AIGC下一个亿万赛道?价值会落地在何处

AIGC全称为AI-Generated Content,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。从具体的角度来看,人工智能内容生成意味着人工智能开始在现实内容中扮演新的角色,从 "观察和预测 "扩展到 "直接生成和决策"。

在分析了现有的技术能力和实施场景后,"生成 "应定义为包括基于线索的部分生成、完全自主生成和基于引子的优化生成。"内容 "包括图像、文本、音频、策略、情节、训练数据和其他内在逻辑内容。下图介绍在未来有快速增长潜力的项目。

图1 AIGC内容生成

文本生成

文本生成可以根据交互性的强弱分为非交互文本和交互文本。非交互文本中结构化写作有比较强的规律,它包括新闻播报等。非结构化写作需要一定创意和个性化,比如剧情续写、营销文本等。另外可就是辅助性写作,虽然在严格意义上不属于AIGC,但也能起到相关内容,帮助润色。交互文本像闲聊机器人、文本交互游戏等,比如Al dungeon等。

图2 AIGC文本生成

音频生成

音频生成可以应用于音乐和有声读物的内容创作,以及视频、游戏和其他领域的配乐创作,降低了音乐创作的成本。像生成虚拟人歌声、播报等,属于文本生成特定语音。音频生成包括作曲和编曲,在实践中通常包括自动作词。

图像生成

此类技术可以主要应用于去除水印、提高分辨率、特定滤镜等,作为一种常用的图像编辑工具。2022年被称为“AI绘画”之年,有很多超前惊喜的技术被展现出来,比如随机或按照特定属性生成画作等,根据指定要求生成营销类海报、模特图、logo等。

视频生成

通过对目前AI绘画的应用的初步验证,我们可以把这个技术看作是文本生成图像的进阶版技术。AI绘画和AI视频即将迎来广泛的应用。它可以实现删除特定主体、生成特效、跟踪剪辑、对特定片段进行检测及合成、视频换脸等。

图3 AIGC视频生成

图像、视频、文本间跨模态生成

我们首先看一下模态的概念:模态指的是不同的信息来源或模式,目前主要是音频、文本、视觉等。Transformer架构的跨界应用成为跨模态学习的重要开端之一。CLIP模型的出现成为跨模态生成应用的一个重要节点。CLIP随后在视频、音频和三维建模等领域发挥了关联不同CLIP的作用。大型预训练模型的发展重点开始转向跨越文本、图像、语音和视频的全模态通用模型。多模态生成,将多种模态的信息同时作为一项特定任务的输入。

Game AI

主要内容有uAI Bot、NPC,可以简单理解为人工智能玩家,重点是生成真实的对战策略。AI技术在2016年的游戏领域震撼了世界,Deepmind AlphaGO、Dota2、StarCraft2等等。GameAI在行业内的后续发展,关键在于游戏行业的接受度,以及来自底层架构的相关接口支持 GameAI在行业内的后续发展,关键在于游戏行业的接受度,以及来自底层架构的相关接口支持。目前,国内游戏厂商合作意愿良好,普遍存在内部开发或外部测试的需求。

此前布局较早的企业,在技术方面已经领先很多,国内AIGC领域的大规模稳定生产能力需要进一步提升,完成从尝鲜方式向正规和商业化的各种场景的转变。未来,各项AIGC能力有望在控制成本的前提下实现产业化生产。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值