AIGC风口，人工智能又又又行了吗？

最新推荐文章于 2024-06-26 11:51:04 发布

AIGC-Lison

最新推荐文章于 2024-06-26 11:51:04 发布

阅读量561

点赞数 28

文章标签： AIGC 人工智能 midjourney

本文链接：https://blog.csdn.net/z19981/article/details/139982590

版权

AIGC是一个和PGC和UGC对应的概念，原来是专业机构生产内容和用户生产内容，现在AI也可以生产内容，且内容质量让用户感觉还不错，甚至优秀。

AIGC俨然已经成为了新的风口，如果大家关注了各种互联网媒体，就会感觉AIGC已经甚喧尘上了。web3.0和元宇宙什么的作为古典互联网老农民，看不懂就不搀和了，AIGC在我的理解能力范围内，我就研究了一波。

今天就跟大家分享下目前整合的信息，以及我对这些信息的理解。

一、为什么爆火？

一句话总结就是在用户感知到，AI生产的内容，已经在某些达到了以假乱真的地步，甚至在有些场景下好像超过了人类。柯洁被AlphaGo击败，引爆了上一波AI热潮，这波AIGC的热潮，也是由几个事件引起的。

事件一：22年8月《太空歌剧院》在美国科罗拉多州举办艺术博览会获奖，这幅画作最终获得数字艺术类别冠军，而这幅画作实际上是由作者利用Midjourney的文字转图片工具生成。前一阵子大火的文字生成图片，大部分就是用Midjourney。
在这里插入图片描述
事件二：22年11月30日ChatGPT模型发布。和之前的微软小冰不同，ChatGPT的聊天模式更加自然顺畅，不仅可以完成相对自然的多轮对话，还可以完成多种文本相关任务。也在科技圈掀起了热潮。

事件三：22年11月Lensa发布了AI魔法头像，其下载量在 12 月的前 5 天被下载安装了 400 多万次，目前仅这一项功能就带来了上千万美金的收入。不同于一般滤镜软件的修改图片，Lensa则是创造性地生成图片。在保留基本外貌特征的基础上，可以生成多种类型的人物画像，在社交网络中形成了新风潮。对了，lensa应用商店有，十几块钱可以生成一堆头像，可以自己玩一下。

三个事件在短期内爆发式事件，让大家猝不及防，原本以为AI无法攻克的文本创作和图片创作领域好像被突破了，平静的风投圈和科创圈一下子又重新沸腾了。

二、大规模的融资

据风投公司NFX统计，目前已有约450家生成式AI公司，它们一共筹集了将近120亿美元的资金(统计口径是历史累计），最近几个月AI领域融资超过了过去5年的总和。

简单列举一下部分比较大额的融资事件，这些公司后续也都会有进一步的分析。

Jasper，2022 年 10 月，融资 1.25 亿美元，成立 18 个月后就达到了 15 亿美元的估值，仅21年收入3000万美金，22年收入超过6000万美金。使用的算法内核为GPT-3（Open AI）。

Stability AI， 2022年10月完成种子轮1亿美金，估值10亿美金，据传在寻求10亿美金融资。

Descript ，2022年10月公布完成了由 OpenAI 领投的新一轮融资5000万美金，估值达到了 5.5 亿美金，一站式音视频协同编辑工具，可以让你对音频视频的编辑就像写 Word 文档一样。

PhotoRoom，2022年11月宣布完成了 1900 万美金的 A 轮融资。业务是做toB的电商图片处理，每年营收100万美金以上，其 AI 部分能力由Stable Diffusion 提供。

Runway ，12月5000万美元C轮融资，公司估值5亿美元，主打图像文本生成工具。

Copy.AI 创意扩展工具，年收入突破1000万美金，年费49美金，内核是GPT-3（Open AI），目前已经融了大概 1400 万美金。

Speak ，22年11月获得2700万美金B轮融资，由OpenAI旗下的基金OpenAI Startup Fund领投，AI口语，日常互动。

Verbit ，创立 5 年，3000 个B端客户，总计融资 5.69 亿美金（其中 4 亿美金在去年完成），估值 20 亿美金，4 年时间 ARR 即达到 1 亿美金，人工智能转录和字幕平台。

三、AIGC公司类型

可以把上述公司做一下简单的分类。

基础大模型

包含：OpenAI（ChatGPT），Midjourney，Stability AI，提供基础的大模型，实现接口化的AI方案，文字生成、图片生成等。这样的公司需要专业团队长时间积累，并且需要海量的资金投入，一旦成功，可以获取最高的估值和融资，未来有机会成为新的基建公司。其中看似几十人小公司的Midjourney来看，创始人其实是leap motion的创始人，十年前在AR市场上就做出了消费级产品（有幸在学校人因实验室玩过）。

有算法内核的内容生产工具

包括：Descript，Runway，Verbit。产品形态复杂，需要在行业有足够的深耕，且有一定的算法能力和产品能力，一旦完成有很深的门槛和壁垒，形成护城河。特别说一下verbit这家公司，作为一家to B公司实现了年收入1亿美金，盈收能力已经是AI领域的佼佼者。人工智能转录和字幕其实是AI的传统能力范围，但是一般而言准确率只有90%左右，商业使用有很大问题，而Verbit的做法是，把中间结果分配给上万名兼职翻译人员做校对，在人工智能和人的配合下，达到了99%的准确率，这是非常有意思的创新。

有算法能力的C端用户产品

上面提到的Speak这家公司就是这个范畴。需要对算法有定制化创新，同时也需要足够的产品打磨，有用户获取和推广成本。与此同时产品难以被快速复制，可以形成领先能力，获取收入。

月活10万，年费100美金，年收入千万美金。核心功能是提供了AI外教的互动，相比于流利说解决了外语跟读开口的问题，Speak解决了，外语对话开口的问题。不仅是更便宜，和机器对话的压力也远比和真人对话的压力低。

无算法内核应用类产品

包括：Lensa，PhotoRoom，Jasper，Copy.AI，其中前两者基于Stability AI的Stable Diffusion 开发，后两者基于Open AI的GPT-3开发。这类产品需要找到合适的场景，本质是解决算法模型到用户的最后一公里。

其中PhotoRoom就是把比较杂乱的商品图，处理成电商通用的白底图、调性图等，PR说可以提升转化率30%，所以客户愿意付费。Jasper是一个更有意思的案例，去年10月份融资1.25亿美金之后风头正盛，据说实现了上亿的ToB收入，但11月份ChatGPT开放之后覆盖了大部分Jasper的付费功能。且目前OpenAI对外只提供上一代GPT-3的能力，Jasper正在无限尴尬中。

四、算法大突破了吗？

前面是一些投资机构行研的实习生能收集的信息，接下来实习生们就开始鼓吹技术突破，同时大胆畅想未来。那么算法领域有大突破吗？

这要看怎么定义大突破，用户体验从难以接受的人工智障，进化到了偶有惊喜的人工智能这显然也是有突破的。但与此同时语言大模型说的话要么不太对，要么就是车轱辘话，还是垃圾营销号水平。其实图像模型也是这个水平，不过图像一般人没有更高级的鉴赏能力，对于画作中的错误没办法看出来，所以图片领域更容易让用户吃惊。

从算法原理上来看，算法领域没有大的理论突破。大白话来说，AIGC们的模型可以总结为三个模块，编码器，解码器，翻译器。编码器将图片、视频、文字等信息编码，解码器将信息编码调整为图片、视频、文字。而翻译器则基于2017年Google论文里提出的Transformer机制实现。还是深度神经网络，海量数据，上亿的参数堆砌的模型。

ChatGPT这样级别的预训练大模型跑一次的成本是千万美元级别，所以上线以来没有动过。ChatGPT单轮对话成本为几美分，大约十句话一块钱，而将其商业化部署，落地到类似聊天机器人这样多用户高并发任务中，成本只会更高。小冰 CEO 李笛给出的一个估计数字是 3亿每天。根据 Business Insider 的数据，Stability AI 目前拥有一个在 AWS 中运行的由 4000 多个 Nvidia A100 GPU 组成的集群，用于训练包括 Stable Diffusion 在内的 AI 系统，这导致其运营和云服务方面的支出超过了 5000 万美元。需要说明的是，训练成本仅仅是成本的一部分，除此之外，还有开发人员成本和其他服务成本。

需要特别说明的是，这轮算法和Deepmind的AlphaGo有本质区别，AlphaGo的强化学习算法属于进化学派，而这轮AIGC算法是联结学派。（相关信息可以参考之前的文章：构成|学派|算法·给PM的算法知识汇总）

目前的AI性能提升，并不是算法的底层突破（应用层还是有创新的），而是受益于大数据和云计算的发展。联结学派可以处理海量数据，在合适的算法结构下，能解决多方面的问题。强化学习在算力增强的情况下，性能可以持续提升。

有人敢不惜代价堆算力大规模计算，于是用户体验从难以接受到偶有惊喜。

五、未来的发展

对于大部分商业公司而言，原创个基础大模型基本无法实现，明星团队和海量资金是非常高的门槛。但基础大模型也有自己商业化问题，在GPT-3阶段，使用GPT-3内核的Jasper的营收比OpenAI还高。

基础大模型一旦开始有巨大商业价值，可能会面临完全不同的竞争格局。因为进入门槛并没有那么大，本质上是堆算力的问题。就和云计算一样，大家发现可以赚钱了，各大互联网公司都纷纷开始搞自己的云平台了。

对了。云平台是这个AI浪潮的隐藏赢家，淘金不一定赚钱但给淘金者卖水反而可以赚大钱，目前各个平台破模型的钱很多也都是在云平台烧掉了。

对于普通公司，如果要用大模型的技术，那么就要解决大模型的最后一公里问题。仅仅是复制已实现场景是不行了，没有先发优势，也无法超过对方的效果，无法盈利也无法吸引资本。而场景创新则非常困难，例如Lensa本身是做了很久滤镜AI的工作，有行业和技术积累，这也是他们能爆火的基础。

而且有些商业机会有窗口期，大模型现在不能解决不代表未来不能解决。就像当年应用商店也是创业风口，但各大厂商做了自己的应用商店后，这个生意就不行了。事后诸葛亮式地看，Jasper功能被ChatGPT攻破，几乎就是必然。

或者不要在乎AIGC的风口下大模型的能力，而是选择在自己的行业做重，探索用AI解决行业问题，趁着这波热潮融资拿钱。这需要行业合适，且在基础能力上达到这个行业通用的能力，在这个基础上进行突破创新。比如抖音的推荐和各种AI滤镜，就提高了短视频生产端的质量，也成为了抖音破圈的核心竞争力。

要做好算法和业务的结合，需要的产品设计能力和以往的能力模型完全不同。需要懂算法懂业务。甚至很多大公司，也没有这个能力。

大多数情况下，算法的人总假设业务场景非常理想，仿佛一切都是均匀球体，然后用各种高级的模型去做，发现没有效果；然后业务的人用不超过小学数学的数学工具，建立一些过家家式的规则。
但由于AIGC刚刚爆火，网上相关内容的文章博客五花八门、良莠不齐。要么杂乱、零散、碎片化，看着看着就衔接不上了，要么内容质量太浅，学不到干货。

这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》，相信大家会对AIGC有着更深入、更系统的理解。

有需要的朋友，可以点击下方免费领取！

AIGC所有方向的学习路线思维导图

这里为大家提供了总的路线图。它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去，那么我的使命也就完成了：
在这里插入图片描述

AIGC工具库

AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合，通过使用AIGC工具库，能更加快速，准确的辅助我们学习AIGC
在这里插入图片描述

有需要的朋友，可以点击下方卡片免费领取！

精品AIGC学习书籍手册

书籍阅读永不过时，阅读AIGC经典书籍可以帮助读者提高技术水平，开拓视野，掌握核心技术，提高解决问题的能力，同时也可以借鉴他人的经验，结合自身案例融会贯通。

在这里插入图片描述

AI绘画视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，科学有趣才能更方便的学习下去。

在这里插入图片描述

AIGC-Lison

关注

28
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
AIGC风口，人工智能又又又行了吗？

AIGC是一个和PGC和UGC对应的概念，原来是专业机构生产内容和用户生产内容，现在AI也可以生产内容，且内容质量让用户感觉还不错，甚至优秀。AIGC俨然已经成为了新的风口，如果大家关注了各种互联网媒体，就会感觉AIGC已经甚喧尘上了。web3.0和元宇宙什么的作为古典互联网老农民，看不懂就不搀和了，AIGC在我的理解能力范围内，我就研究了一波。今天就跟大家分享下目前整合的信息，以及我对这些信息的理解。
复制链接

扫一扫