AIGC下一个亿万赛道？价值会落地在何处

最新推荐文章于 2024-09-03 17:37:15 发布

快联科技AI购

最新推荐文章于 2024-09-03 17:37:15 发布

阅读量132

点赞数

文章标签：人工智能科技算法 ai 深度学习 Powered by 金山文档

本文链接：https://blog.csdn.net/quickaigo/article/details/129167178

版权

AIGC全称为AI-Generated Content，通过已有数据寻找规律，并通过适当的泛化能力生成相关内容的技术。从具体的角度来看，人工智能内容生成意味着人工智能开始在现实内容中扮演新的角色，从 "观察和预测 "扩展到 "直接生成和决策"。

在分析了现有的技术能力和实施场景后，"生成 "应定义为包括基于线索的部分生成、完全自主生成和基于引子的优化生成。"内容 "包括图像、文本、音频、策略、情节、训练数据和其他内在逻辑内容。下图介绍在未来有快速增长潜力的项目。

图1 AIGC内容生成

文本生成

文本生成可以根据交互性的强弱分为非交互文本和交互文本。非交互文本中结构化写作有比较强的规律，它包括新闻播报等。非结构化写作需要一定创意和个性化，比如剧情续写、营销文本等。另外可就是辅助性写作，虽然在严格意义上不属于AIGC，但也能起到相关内容，帮助润色。交互文本像闲聊机器人、文本交互游戏等，比如Al dungeon等。

图2 AIGC文本生成

音频生成

音频生成可以应用于音乐和有声读物的内容创作，以及视频、游戏和其他领域的配乐创作，降低了音乐创作的成本。像生成虚拟人歌声、播报等，属于文本生成特定语音。音频生成包括作曲和编曲，在实践中通常包括自动作词。

图像生成

此类技术可以主要应用于去除水印、提高分辨率、特定滤镜等，作为一种常用的图像编辑工具。2022年被称为“AI绘画”之年，有很多超前惊喜的技术被展现出来，比如随机或按照特定属性生成画作等，根据指定要求生成营销类海报、模特图、logo等。

视频生成

通过对目前AI绘画的应用的初步验证，我们可以把这个技术看作是文本生成图像的进阶版技术。AI绘画和AI视频即将迎来广泛的应用。它可以实现删除特定主体、生成特效、跟踪剪辑、对特定片段进行检测及合成、视频换脸等。

图3 AIGC视频生成

图像、视频、文本间跨模态生成

我们首先看一下模态的概念：模态指的是不同的信息来源或模式，目前主要是音频、文本、视觉等。Transformer架构的跨界应用成为跨模态学习的重要开端之一。CLIP模型的出现成为跨模态生成应用的一个重要节点。CLIP随后在视频、音频和三维建模等领域发挥了关联不同CLIP的作用。大型预训练模型的发展重点开始转向跨越文本、图像、语音和视频的全模态通用模型。多模态生成，将多种模态的信息同时作为一项特定任务的输入。

Game AI

主要内容有uAI Bot、NPC，可以简单理解为人工智能玩家，重点是生成真实的对战策略。AI技术在2016年的游戏领域震撼了世界，Deepmind AlphaGO、Dota2、StarCraft2等等。GameAI在行业内的后续发展，关键在于游戏行业的接受度，以及来自底层架构的相关接口支持 GameAI在行业内的后续发展，关键在于游戏行业的接受度，以及来自底层架构的相关接口支持。目前，国内游戏厂商合作意愿良好，普遍存在内部开发或外部测试的需求。

此前布局较早的企业，在技术方面已经领先很多，国内AIGC领域的大规模稳定生产能力需要进一步提升，完成从尝鲜方式向正规和商业化的各种场景的转变。未来，各项AIGC能力有望在控制成本的前提下实现产业化生产。

快联科技AI购

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
AIGC下一个亿万赛道？价值会落地在何处

GameAI在行业内的后续发展，关键在于游戏行业的接受度，以及来自底层架构的相关接口支持 GameAI在行业内的后续发展，关键在于游戏行业的接受度，以及来自底层架构的相关接口支持。我们首先看一下模态的概念：模态指的是不同的信息来源或模式，目前主要是音频、文本、视觉等。在分析了现有的技术能力和实施场景后，"生成 "应定义为包括基于线索的部分生成、完全自主生成和基于引子的优化生成。音频生成可以应用于音乐和有声读物的内容创作，以及视频、游戏和其他领域的配乐创作，降低了音乐创作的成本。图2 AIGC文本生成。
复制链接

扫一扫