Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

编辑:编辑部

【新智元导读】大火的文本到图像模型Stable Diffusion2.0版本来了,然而因为这个原因,广大网友们闹起来了。


昨天,Stability AI宣布,Stable Diffusion 2.0版本上线!

这个更新速度,可太神了。

1.0版本在今年8月出炉,三个月不到,还热乎着呢,新版本就来了。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

Stable Diffusion 2.0


昨日,Stability AI在博客上发布了深度学习文本到图像模型的最新版本Stable Diffusion 2.0

相较于1.0,新的算法比之前的更高效、更稳健。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

时间回到几个月前,Stable Diffusion的发布,掀起了一场文本到图像模型领域的新革命。

可以说,Stable Diffusion 1.0彻底改变了开源AI模型的性质,并且在全球范围内催生了数百种新模型,和其他方面的进步。

它是最快达到10K Github star星数的项目之一,在不到两个月的时间里飙升至33K星,在Github上的一众项目中可以封神了。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

开发Stable Diffusion 1.0版本的团队是Robin Rombach(Stability AI)和 Patrick Esser(Runway ML),他们来自LMU Munich CompVis Group。

在实验室之前的Latent Diffusion Models基础上,他们开发出了Stable Diffuision 1.0,并且得到了 LAION 和 Eleuther AI 的大力支持。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

这次的Stable Diffusion 2.0版本,具有强大的文本到图像模型。

这个模型是由LAION在全新的文本编码器OpenCLIP训练的,跟1.0版本相比,它显著提高了生成图像的质量这次的模型可以输出默认分辨率为512×512像素和768×768像素的图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

使用Stable Diffusion 2.0生成的图像示例,分辨率为768x768

模型在Stability AI的DeepFloyd团队创建的LAION-5B数据集上进行训练。

LAION-5B是一个包含58.5亿个CLIP过滤图像文本对的数据集,比LAION-400M大14倍,曾是世界上最大的可公开访问的图像文本数据集。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

训练完成后,就使用LAION的NSFW过滤器进一步过滤,删掉「成人内容」。

这对于很多网友来说,堪称是「史诗级削弱」

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

LAION 5B的采集管道流程图

2.0比1.0强在哪里?


具体来看,2.0比1.0有了哪些升级呢?

图像生成质量明显提升

上文我们已经看到,2.0版本中的文本转图像模型默认可以生成512x512 和 768x768 像素分辨率的图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

超分辨率Upscaler扩散模型

Stable Diffusion 2.0包含了一个Upscaler Diffusion模型,这个模型可以将图像分辨率提高四倍

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

左图:128x128 低分辨率图像。右图:Upscaler 生成的 512x512 分辨率图像

可以看出,这个模型将低质量生成图像 (128×128) 放大为更高分辨率图像 (512×512) 。

有了Upscaler Diffusion的加持,Stable Diffusion 2.0与以前的文本到图像模型结合使用时,可以生成分辨率为2048×2048或更高的图像。

depth2img深度图像扩散模型

团队采用了一种新的深度引导(depth-guided)稳定扩散模型depth2img。

它扩展了1.0之前的图像到图像功能,为创意应用提供了全新的可能性。

通过使用现有模型,Depth2img能够推断输入图像的深度,然后使用文本和深度信息生成新图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

左边的输入图像可以产生几个新图像(右边)。这种新模型可用于保持结构的图像到图像和形状条件图像合成(structure-preserving image-to-image and shape-conditional image synthesis)

Depth-to-Image

Depth-to-Image 可以提供各种新的创意应用程序,转换后的图像看起来与原始图像截然不同,但仍保持了图像的连贯性和深度。

更新文本引导修复扩散模型

此外,这次更新还引入了一个新的文本引导(text-guided)修复模型,在新的Stable Diffusion 2.0文本到图像的基础上进行了调整,这样,用户就可以非常智能、快速地替换图像的部分内容。

更新后的修复模型在 Stable Diffusion 2.0 文本到图像模型上进行了微调

过滤掉一些NSFW(不可描述)的内容

经过LAION的NSFW过滤器,「成人内容」都会被砍掉。

总结一下,Stable Diffusion 2 的更新如下

  • 新的SD模型提供了768×768的分辨率。
  • U-Net的参数数量与1.5版相同,但它是从头开始训练的,并使用OpenCLIP-ViT/H作为其文本编码器。一个所谓的v预测模型是SD 2.0-v。
  • 上述模型是由SD 2.0-base调整而来,它也是可用的,并作为典型的噪声预测模型在512×512图像上进行训练。
  • 增加了一个具有x4比例的潜在文本引导的扩散模型。
  • 完善的SD 2.0基础的深度引导的稳定扩散模型。该模型可用于结构保留的img2img和形状条件合成,并以MiDaS推导的单眼深度估计为条件。
  • 在SD2.0的基础上建立了一个改进的文字引导的绘画模型。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

在博客最后,Stability AI团队激动地说

就像Stable Diffusion的第一次迭代一样,我们努力优化模型,让它在单个GPU 上运行,因为我们希望从一开始就让尽可能多的人可以使用它。

我们已经看到,当数百万网友接触到这些模型时,他们共同创造了一些令人惊叹的作品。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

这就是开源的力量:挖掘数百万有才华的人的巨大潜力。他们可能没有资源来训练最先进的模型,但他们有能力用一个模型创造令人难以置信的成果。

这个新版本及其强大的新功能,将成为无数应用程序的基础,并激发人们全新的创造潜力。

第一家AI绘画「独角兽」


作为机器学习模型的一种,「文本-图像模型」能够将自然语言描述作为输入并生成与该描述匹配的图像。

它们通常结合了语言模型生成图像模型:语言模型将输入文本转换为潜在表示,生成图像模型则将该表示作为条件生成图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

最有效的「文本-图像模型」,通常是根据从网络上抓取的大量图像和文本数据进行训练的。

依托深度神经网络技术的飞速进步,「文本-图像模型」从2015年开始获得广泛重视。

OpenAI的DALL-E、Google Brain的Imagen等,都能输出质量与真实照片相接近的绘画作品。

Stability AI创建的绘画平台Stable Diffusion,则成为领域杀出的一匹「黑马」。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

Stable Diffusion的母公司Stability AI,成立于2020年,总部位于伦敦。

公司背后的出资人是数学家、计算机科学家Emad Mostaque,来自孟加拉国,今年39岁。

Mostaque毕业于牛津大学数学和计算机科学学院,曾在一家对冲基金公司工作过13年。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

凭借Stability AI和他的私人财富,Mostaque希望能够培育一个开源AI研究社区。他的创业公司之前就支持创建「LAION 5B」数据集。

为了训练Stable Diffusion的模型,Stability AI为服务器提供了4,000个Nvidia A100 GPU。

与OpenAI旗下多款AI工具平台不同,开发者可以免费下载Stability AI的底层代码,来训练自己的模型。

Stability AI官网顶部的Slogan「AI by the people,for the people」,正是这种价值观的最好诠释。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

「人类面临的一些重大挑战有望通过AI解决,」Emad Mostaque表示,「但只有当这项技术面向所有人时,我们才可能达成这一目标。」

「除了我们的75名员工之外,没有任何其他人拥有决策权无论是亿万富翁、大型基金,还是政府,我们是完全独立的。」Mostaque说,「我们计划使用我们的计算来加速基础人工智能的开源。」

Stable Diffusion是Stability AI独立研发的「文本到图像模型」,于2022年8月发布,一经推出便迅速被一众网友玩疯了。

比如被变成黑寡妇的马院士

作为目前可用性最高的开源模型,Stable Diffusion在短短2个月的时间里已经被全球超过20万名开发者下载和使用。

Stability AI面向消费者的产品名为DreamStudio,目前已经拥有超过100万名注册用户他们共同创建了超过1.7亿张图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

今年10月,Stable Diffusion母公司Stability AI获得了由全球风险投资公司Lightspeed Venture Partners和Coatue Management领投的1.01亿美元融资,估值突破了10亿美元,也是AI绘画领域的第一家「独角兽」。

11月24日,刚刚完成融资的Stability AI便发布了2.0版本,这也让我们对Stable Diffusion的未来产生了更多期待。

网友:体验下降,差评!


不过在国外社交媒体上,不少网友却对Stable Diffusion的本次更新给出了「差评」,理由自然是「模型生成NSFW内容和图片的能力被削弱了」。

是的,这次模型的关键组件功能被改进,使得Stable Diffusion更难生成某些引起争议和批评的图像了,比如广受欢迎的裸体和色情内容、名人的逼真照片以及模仿特定艺术家作品的图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

「他们削弱了模型,」一位用户在Stable Diffusion的reddit上评论道,还获得了208次点赞,完全能代表广大网友的心声。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

另一位用户则表示:「他们切除并『阉割』了模特。没有艺术,没有人体的自然美,没有画家和摄影师最好的作品中描绘的生死戏剧,这比丑陋本身还要糟糕。」

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

NSFW的全称是「Not Suitable For Work」,简单讲就是一些不适合上班时间浏览的东东。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

与OpenAI的DALL-E等「竞争对手」不同,Stable Diffusion是一款完全开源的软件。这允许社区的小伙伴一同开发、改进这款产品,并让开发人员免费将其集成到他们的产品中。

Stable Diffusion「背后的男人」Emad Mostaque曾将它比作「披萨基地」,任何人都可以添加他们选择的成分(训练数据)。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

Stability AI首席执行官Emad Mostaque

「一个好的模型应该可以供所有人使用,如果你想添加东西,那就加。」他在Discord上表示。

这意味着Stable Diffusion在使用方式上的限制比较少,但也因此,它招致了大量批评。

Stable Diffusion和其他图像生成模型在未经艺术家同意的情况下,在他们的作品上进行训练,并重现他们作品的风格,许多艺术家大为光火。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

Stable Diffusion生成特定艺术家风格图像的能力十分强大

这种AI式复制是否合法?目前,这在法律上还是一个悬而未决的问题。

专家表示,在受版权保护的数据上训练人工智能模型可能是合法的,但某些用例可能会在法庭上受到质疑。

可以猜测,Stability AI对模型所做的更改是为了减轻这些潜在的法律挑战。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

这次2.0版本的更新,对软件编码和检索数据的方式进行更改,因此,模型复制艺术家作品的能力大大降低。

正统艺术家满意了,创造力爆棚的「成人艺术家」们却很愤怒。

此前,Stable Diffusion就因「涩图生成神器」之名蜚声海内外。

老司机们用它生成一些极具真实感和动漫风格的NSFW内容,甚至包括一些特定个人的NSFW图像(也称非自愿色情)和虐待儿童的图像。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

前两天,一款专门生成高质量色情内容而量身定制的AI系统「Unstable Diffusion」应运而生。

此后,大量Reddit和4chan的网民火速用Unstable Diffusion生成了逼真的裸体图像,被「老司机」们玩出了花。

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

在软件官方Discord中谈到2.0版本的变化时,Mostaque也承认这正是Stable Diffusion从训练数据中删除裸体和色情图片的初心。

「在开放模式中不能有儿童和NSFW,」Mostaque说,「因为这两种图像可以结合起来制作儿童性虐待素材。」

「在儿童和NSFW中,我们只能选择一个。」

Stable Diffusion重磅更新!2.0版“涩图”功能被砍,网友狂打差评

不过在Stable Diffusion的reddit上,一位用户认为「违背了开源社区的精神哲学」,因为删除NSFW内容设立了「审查制度」。

「选择是否制作NSFW内容的权力,应该掌握在用户手中,而不是由审查模式来评判。」

但已经有聪明的网友很快就想通了,安慰了他

Stable Diffusion是开源的,这意味着「这类」训练数据可以很容易地添回第三方版本,而且新软件不会影响早期版本。

参考资料:

https://stability.ai/blog/stable-diffusion-v2-release

https://twitter.com/StabilityAI/status/1595590319566819328?ref_src=twsrc%5Etfw

https://www.reddit.com/r/StableDiffusion/comments/z3ferx/comment/ixlmkkj/?utm_source=share&utm_medium=web2x&context=3

https://theverge.vip/2022/11/24/23476622/ai-image-generator-stable-diffusion-version-2-nsfw-artists-data-changes

免责声明:本文作者:“新智元”,版权归作者所有,观点仅代表作者本人。本站仅提供信息存储分享服务,不拥有所有权。信息贵在分享,如有侵权请联系ynstorm@foxmail.com,我们将在24小时内对侵权内容进行删除。
(67)
三星4521f(为什么三星4521f开机
上一篇 2024年01月29日
iphone6参数(苹果iphone7参
下一篇 2024年01月29日

相关推荐

  • 屏保程序下载(安卓大屏车机怎么设置屏保)

    4.选择您想要设置为屏保的选项。通常情况下,车机厂商会提供一些默认的屏保,您也可以通过下载第三方屏保应用程序来增加更多的选项。...

    2023年11月11日
  • mivsn(魅声mivsn怎么充电)

    拓展资料:需要注意的是使用正确的充电线可以延长电池寿命(或者说最大限度保持电池的健康使用),通常的充电线规格和手机充电线可以混用,但是还是不要太随便的乱用,最好使用原装线材,一般可以买到,实在找不到原装的就去查一查,对应合适的规格找替代品。...

    2023年11月16日
  • 注册表编辑器被禁用(eps更新注册表失败怎么解决)

    1,要解禁组策略,当然先得进入,进入方法,在开始菜单中,打开运行程序,然后在打开的运行框中输入gpedit.msc命令,确定。...

    2023年11月17日
  • 创新5.1声卡驱动(科声声卡怎么连接电脑)

    1.通过USB接口把外置声卡连接到电脑上。创新USBSBX-Fi采用即插即用设计,在不需要安装及依赖任何软件的情况下,可支持PC及移动设备。但是有些外置声卡还需要重新安装驱动,可以直接用驱动精灵解决。当然如果产品本身配有驱动光盘,直接插入光盘...

    2023年11月17日
  • iphone 7价格(有人报一下95新iphone7的价格吗)

    1渠道苹果直营店,苹果官网和淘宝苹果直营店这三个渠道是最正规的。授权店专卖店很容易买到翻新机。注意京东专卖店不支持激活后退货的。...

    2023年11月24日
  • 用这么多年Win10你真的懂?Win10超强模式玩过没

    Win10就像一个大宝库,总能带给我们很多惊喜。电脑慢了、游戏卡了,也许就是你的模式没选对。那么Win10里最牛X的8大模式,你都用过吗?一起来和小编看看吧。Top1、卓越模式电脑慢了,游戏卡了,首先想到的就是性能模式。高性能是很多人认为的最...

    2024年01月18日
  • Nokia 9 PureView评测:一款瑕不掩瑜的“另类”旗舰

    【手机中国评测】细数手机行业的品牌,每个人脑海中想起的都不尽相同,对于我个人而言,第一个想到的是诺基亚。它承载了我年轻时的很多美好回忆,就好像一个相识很久的朋友,陪伴我做过了无数的平淡却不平凡的日子。相信很多人对诺基亚有着莫名的情愫,作为曾经...

    2024年02月01日
  • 诺基亚3806(诺基亚有没有电信版的功能机)

    Hi!中国内地上市的诺基亚电信版手机有Nokia8208、Nokia6316s、Nokia3806、Nokia2865、Nokia2608等产品。我们也会将您的需求反馈至诺基亚,以不断推出新产品,致力为用户带来更好的体验。...

    2024年05月14日
  • 139魔域外挂(魔域128到139怎么升级)

    1.魔域128到139的升级方法是通过接取主线任务完成,获得经验升级。2.主线任务是游戏中升级最基本的途径,完成任务可以获得大量经验,快速提升等级。当玩家等级越高,完成主线任务所获得的经验也就越多。因此,不断接取并完成主线任务是升级的有效方式...

    2024年06月15日
  • ppghost(重装系统然后开不了机了怎么办)

    如果仍然无法解决问题,可能是手机软件系统出现了问题。此时可以尝试同时按下手机的主屏Home键+电源键,直到屏幕被点亮,有显示为止。如果这个方法不管用,可以将手机接入电源,然后再同时按下电源与主屏Home键,看看是否可以重新开机。...

    2024年06月26日
返回顶部