你可能不知道，Diffusion现在有多火

最新推荐文章于 2024-09-11 13:31:30 发布

人工智能与算法学习

最新推荐文章于 2024-09-11 13:31:30 发布

阅读量1.9k

点赞数 6

文章标签：人工智能机器学习深度学习 python 大数据

原文链接：https://mp.weixin.qq.com/s?__biz=MzIyOTkyOTEzOQ==&mid=2247495889&idx=2&sn=9e4ca31aa813503dd24f1f79728900ad&chksm=e8b9890ddfce001b776d49da2937690a8d04a0f956923b7e10f4b5f4b14542a7e86deb1ad5c9&scene=126&&sessionid=0

版权

就在一个月前，我还很疑惑为什么大厂们都要去卷文本生成图像，当时自己总结了两个有价值的落地点（美术教育和内容生成），但始终不太exciting，感觉现在的技术离目标还有不少距离。

结果才短短一个月，我的认知就被革新了。

在过去的一两周里，我的twitter每天都在被Diffusion刷屏，各种玩法层出不穷。如果这样描述你没有感觉，那你可以打开这个网站，来看看过去一周内Diffusion相关的新项目列表：

https://multimodal.art/news/1-week-of-stable-diffusion

我数了一下，非完全统计一共24个，平均每天就有3+个Diffusion的项目，仿佛是一个新的大航海时代。

Stable Diffusion

这次火爆的源起，是慕尼黑大学的CompVis组，联合Stability AI^[1]和Runway^[2]发布了他们预训练的Diffusion生成模型^[3]。

不就开源了一个模型吗？有啥呢？

首先，它开源。别看OpenAI的DALLE2和Google的Imagen效果都那么好，可他们都是半开不开的，Diffusion的训练成本更高，普通人根本训不起。这次能开源要得益于Stability AI的加持，由国外超级富豪Emad Mostaque创办，目标是创造开源的AI工具，大家可以把它当成真正的「Open AI」。这次的Stable Diffusion，是Stability AI的第一个公开产品，在4000台A100上训了一个月^[4]，有钱真好。

其次，它轻量，一张10GB以上显存的卡就能跑。要知道即使DALLE2开源了，普通人也是用不起的，而Stable Diffusion经过优化后一张卡就能放得下了，做到了真真正正的亲民。

最后，它效果真的好，好到能商用。这主要归功于高质量数据集LAION^[5]的加持，我分别挑了DALLE2和Imagen的prompt来对比，感觉Stable Diffusion不亚于那两个大模型：