开源风暴吞噬AI界?从Stable Diffusion的爆火说起

8b442511564459af91fe2beac9e051a9.jpeg

近日,文本生成图像模型Stable Diffusion背后的公司Stability AI宣布获得了1.01亿美元超额融资,估值达10亿美元,这家基于开源社区的“草根”企业的风头一时间甚至盖过了业界顶级研究机构OpenAI。

本文作者认为,尽管开源项目存在商业模式、开源许可协议等方面的挑战,但通过良好开源社区的驱动,AI项目的技术发展、应用广度和创造空间都有了意想不到的发展,正如开源“吞噬”软件1.0,“开源AI”运动将在软件2.0时代不可阻挡。OneFlow社区对此进行了编译。

作者|swyx

翻译|胡燕君、贾川

文本转图像模型的发展周期历时数年:

  • 2020年7月:OpenAI发文介绍Image GPT模型,将语言模型应用到图像领域。

  • 2022年3月:AI图像生成平台Midjourney启动Beta版本测试。

  • 2022年4月:OpenAI宣布允许一定数量的用户对其AI图像生成工具DALL-E 2 进行“研究性试用”。

  • 2022年5月:Google以论文形式公布其文本-图像生成模型Imagen,Imagen由PyTorch实现。

  • 2022年7月:OpenAI 通过UI/API开放DALL-E 2进行公开测试,参与公测的用户须先进入等待名单。

  • 2022年7月:Midjourney通过Discord通讯平台发布消息表示即将进行公开测试。

  • 2022年8月:文本-图像生成模型Stable Diffusion发布,这是一款基于OpenRAIL-M许可的开源模型。

  • 2022年9月:OpenAI取消DALL-E 2的等待名单。

GPT-3从公布到被复制历时10个月:

  • 2020年5月:OpenAI以论文形式公开GPT-3,并在随后的6月发布了未公开的Beta版API。

  • 2020年7月:非营利开源研究组织EleutherAI成立,成为OpenAI的替代者。

  • 2020年9月:Microsoft获得GPT-3的独家授权。

  • 2021年1月:EleutherAI公布其800G数据集The Pile。

  • 2021年3月:EleutherAI公布了分别含13亿和27亿参数的两版开源GPT-Neo模型(GPT-Neo是对GPT-3的克隆版)。

  • 2021年11月:OpenAI取消GPT-3的等待名单,开发人员可以直接报名使用其API。

  • 2022年5月:Meta公布大型语言模型OPT-175B,供研究人员使用,还公布了模型日志和开源许可证明。

  • 2022年6月:俄罗斯互联网巨头Yandex公布了YaLM-100B,这是一个基于Apache-2许可的类GPT开源模型。

  • 2022年7月:HuggingFace公开了BLOOM-176B,一个基于RAIL许可证明的大型语言模型。

GPT-2从公布到被复制历时6个月:

  • 2019年2月,OpenAI宣布GPT-2诞生,为了避免模型遭到不良利用(如被用于制造虚假新闻等),当时决定不将模型完全开源;3月,OpenAI放弃“非营利机构”的定位,成立OpenAI LP(有限合伙公司),声称进入“有限营利”经营模式。

  • 8月,两名计算机硕士复制出GPT-2并将其对外公开,称为OpenGPT-2。

  • 11月,经过谨慎的分阶段逐步公布,OpenAI终于完全开源了含15亿参数的GPT-2模型。

上述时间线已经过高度精简,实际发展史还可追溯到2015年提出的扩散模型(Diffusion Model)、2017年提出的Transformer模型,以及更早之前对生成对抗网络&#x

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值