Stable Diffusion背后的故事:独辟蹊径,开源和社区驱动的AI独角兽 | 创始人专访...

dee420d89ccd5e0ed547b4aa62efebc7.png

今日,AI文生图模型Stable Diffusion背后的公司Stability AI宣布获得了1.01亿美元超额融资,此轮融资后,Stability AI 估值已到达 10 亿美元,成为新晋独角兽。领投公司为以支持开源著称的Coatue、Lightspeed以及O'Shaughnessy Ventures。

其资金将用于开发图、文、视频、音频和3D等多模态开源模型。除了Stable Diffusion外,音乐生成算法和工具Dance Diffusion也已经曝光。算力(公司目前在AWS上租用4000台A100)和人才(计划从100增加到300)都是烧钱大户。

据悉,目前Stability AI团队共计103人,有1名博士,明年计划资助超过100位博士。该公司领导团队国际化氛围明显,最近还有来自日本的David Ha和法国的Daniel Jefferies等社区名人加入,分别担任战略负责人和首席信息官。公司发言人表示,未来商业模式类似红帽和MongoDB,开源版本免费,通过商业版本来盈利。而有熟悉公司商业计划书的人士说,更长远的计划是成为一个控股公司,支持多个开源项目的商业化。

AI领域的文生图竞赛已经打响。正如State of AI报告中所说,「文生图扩散模型的狂潮催生了新的 AI 创企。Stability AI和Midjourney几乎是横空出世,而他们开发的文生图模型却可以和成熟的AI实验室比肩。」

号称最强文本生成图片的模型Stable Diffusion诞生于今年8月。其核心技术来源于AI视频剪辑技术创业公司Runway的Patrick Esser,以及慕尼黑大学机器视觉学习组的Robin Romabach。该项目的技术基础主要来自于这两位开发者之前在计算机视觉大会 CVPR22 上合作发表的潜扩散模型(Latent Diffusion Model)研究。

相比较于DALL-E等大模型,Stable Diffusion让用户使用消费级的显卡便能够迅速实现文生图。Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,任何人都可以拷贝使用。在用户层面,它无疑是十分成功的。目前,Stable Diffusion已经有超过20万开发者下载和获得授权,各渠道累计日活用户超过1000万。而面向消费者的DreamStudio则已获得了超过150万用户,已生成超过1.7亿图片。与此同时,它的惊艳艺术风格、以及图像涉及的版权、法律等问题也引发了诸多争议。

1f0f51b3a008df2db5b673c0f12f9427.png

Stable Diffusion模型第一个版本训练耗资60万美元,而提供资金支持正是Stability AI。该公司成立于2020年,最初资金都来自创始人兼CEO Emad Mostaque。Emad印度生人,自小在英国长大,2005年毕业于牛津,有数学和计算机硕士学位,后一直在金融界担任对冲基金分析师。2019年,他曾创立Symmitree,旨在为生活在贫困社区的人们降低智能手机和互联网接入成本。2020年新冠开始后,他又致力于创建新冠数据集。他2020年创办Stability AI的动机,一是自己对AI的痴迷,一是开源AI社区缺乏“组织”。他被投资者评价为「才华横溢、且使命驱动的思想家」,同时其丰富的商业经验让他在产品运营与落地方面另辟蹊径。

3b63791ffee9a529d40bb683e85082bd.jpegEmad Mostaque,Stability AI创始人兼CEO 

除了Stable Diffusion࿰

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值