【原创】AIGC之主流产品介绍

最新推荐文章于 2025-04-23 21:02:03 发布

黑夜路人（heiyeluren）

最新推荐文章于 2025-04-23 21:02:03 发布

阅读量6.4k

点赞数

分类专栏：算法/机器学习/数据挖掘/区块链 AI人工智能文章标签：人工智能 python ChatGPT Midjourney AIGC

本文链接：https://blog.csdn.net/heiyeshuwu/article/details/129843606

版权

算法/机器学习/数据挖掘/区块链同时被 2 个专栏收录

35 篇文章

订阅专栏

AI人工智能

32 篇文章

订阅专栏

AIGC是什么

AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content）。

AIGC就是说所有输出内容是通过AI机器人来生成产出相关内容，主要区别是过去主要是普通用户和某一领域专业用户（人）生产内容，AIGC主要是依赖于人工智能（非人类）生成内容，这个就是AIGC的核心意思。

（版权认定：UGC和PGC是有版权概念的，版权归属于负责生成内容的人，AIGC目前美国法规认为是没有版权概念的，就是内容不属于调用的人，也不属于这个AI机器，所以没有版权归属这件事。）

AIGC可以生成什么内容

目前AIGC主要可以生成文本内容和图片内容（目前视频生成有一些产品，但是没有文本和图片生成这么成熟），所以我们主要集中在文本和图片的AIGC的介绍。

AIGC在文本内容方面，主要可以通过 Q&A （提问回答）得形式进行互动，能够按照人类想要的“提问”生产输出符合人类预期的内容。

一般我们可以把AI当做一个全知全能的“高级人类”，以“文本AIGC”来抡，你可以向它提出问题（Prompt），然后它做出相应回答。所有提问和回答都可以涉及到方方面面，包括不限于百科知识/创意文案/小说剧本/代码编程/翻译转换/论文编写/教育教学/指导建议/聊天陪伴等等等等场景不一而足，场景都需要你去想，可以理解它是一个拥有全地球知识的“百晓生”，什么都可以问它或者跟它交流。

比如我们用大名鼎鼎的 ChatGPT 来进行提问：

对于“图片AIGC”来说，你可能脑子里有无数创意，但是自己不会绘画，无法把脑子里的Idea变成实实在在的图片，那么，“图片AIGC”能够帮助你按照你脑子想要的东西，你告诉它，然后它能够帮助你通过图片绘画的形式给你画出来，让你一下子把自己的“创意”变成了图片现实。

比如我们用非常好用的“图片AIGC” 工具 Midjourney 来画画：

主流AIGC产品

目前AIGC主要是生成文字和图片，目前全球主流比较靠谱的AIGC产品主要是在国外。

文字AIGC产品

OpenAI ChatGPT/GPT-4: http://chat.openai.com

Google Bard：https://bard.google.com

Microsoft NewBing：必应

Baidu ERNIE Bot(文心一言)：文心一言

Github Copilot：GitHub Copilot · Your AI pair programmer · GitHub

图片AIGC产品

Midjourney：Midjourney

Stable diffusion：Stable Diffusion Online

OpenAI DALL.E：DALL·E

百度文心一格：文心一格 - AI艺术和创意辅助平台

视频AIGC产品

D-ID：D-ID Creative Reality Studio

Glia：GliaStudio | 用人工智能视频化你所有的故事

其中，比较靠谱的产品主要是 ChatGPT/GPT-4 和 Midjourney 两个产品是比较成熟可靠的。

文本AIGC产品的介绍

Bard 是Google开发的一个文本对话机器人，是建立在一个大型语言模型基础上的。它可以利用来自网络的信息提供比较新鲜高质量的回答，比如说，Bard可用来比较两部电影，还能根据冰箱里的食物安排午餐吃什么。按照Google官方说法，Bard采用5000亿个参数进行训练，因为是邀请制，还没有完整体验Bard的功能，按照相关信息看，Bard比较容易翻车。

ChatGPT/GPT-4 是OpenAI公司开发的对话机器人，ChatGPT是基于GPT-3.5上面的1750亿个参数进行训练的大语言模型，GPT-4是 ChatGPT 的升级版本，官方没有公开具体训练参数数量，但是肯定比 GPT-3.5要更多，传闻训练参数数量在 1750亿~100万亿之间，从数据来看是非常巨大的。

NewBing 是微软公司开发的在浏览器和Bing搜索引擎中集成的一个对话机器人，它整个底层模型主要是依赖于微软投资的OpenAI公司开发的 ChatGPT/GPT-4 模型为主，基本可以认为是 ChatGPT/GPT-4 在Bing中的另外一个展现版本。

ERNIE Bot（文心一言） 是百度开发的一个大语言模型，ERNIE是一个独立的语言模型（传闻是基于BERT模型进行升级的产品），目前迭代到了3.0版本，具备有千亿参数训练而成，可以支持文字AIGC和图片AIGC。

Github Copilot 是微软控股的 Github 公司开发的一个编程辅助AI工具，使用 GitHub Copilot 可以在软件开发工程中，通过机器学习算法来生成部分代码，可以在程序编辑器中获得整行代码或整个函数的代码建议，可以通过提供半自动完成的建议来帮助编写代码，提高了代码编写的效率和精确度。训练数据应该是整个 Github 平台上面托管的所有开源代码。

图像AIGC产品介绍

图像AIGC产品目前主流的主要有 DALL·E， Stable Diffusion 和 Midjourney等，文心一言也有对应产品，不过目前从网络风评来看会稍微效果有一定提升空间。

DALL-E 2 是OpenAI公司的产品，使用数以百万计的图片数据进行训练，其输出结果更加成熟，非常适合企业使用。当有两个以上的人物出现时，DALL-E 2产生的图像要比Midjourney或Stable Diffusion好得多。

Midjourney 是一个小众的工作室生成，是一个以其艺术风格闻名的工具。Midjourney使用其Discord机器人来发送以及接收对AI服务器的请求，几乎所有的事情都发生在Discord上。由此产生的图像很少看起来像照片，它似乎更像一幅画。

Stable Diffusion 是一个开源的模型，人人都可以使用。它对当代艺术图像有比较好的理解，可以产生充满细节的艺术作品。然而它需要对复杂的prompt进行解释。Stable Diffusion比较适合生成复杂的、有创意的插图。但在创作一般的图像时就显得存在些许不足。

（看三者的大概区别，以为“生成花合雪景结合的图片”查看区别）