1. 背景介绍
数字人、文生视频、图生视频可能是未来to c场景中非常有想象空间的技术。我们将会持续关注。这些技术的应用不仅可以提升用户体验,还能够催生新的商业模式和交互方式。从目前关注到的场景,具有以下几个方面的巨大想象空间:
1.1 数字人(Digital Human,也称为virtual human)
数字人是通过人工智能、3D建模和虚拟现实技术打造的虚拟人物,可以在不同场景下与人类进行交互。
- 虚拟主播和虚拟明星:已经有越来越多的数字人作为主播或明星亮相,比如虚拟主播在新闻、娱乐、直播等领域的应用。。
- 个性化虚拟助手:通过自然语言处理和情感识别,数字人可以提供个性化服务,如在线客服、教育导师等,提升用户体验。
- 虚拟代言人和品牌形象:许多品牌已经开始创建数字代言人或虚拟品牌大使,通过数字化形象进行品牌营销,增强消费者的沉浸感。
如果你使用过抖音、美团、淘宝,可能会发现现在直播推销和带货的,很多都是数字人,真人主播随着技术的发展,基本上会退出历史舞台,更多的会出现在幕后的数字人制作环节,而不是一线带货。在bilibili上,也出现了很多号称情感治愈的数字人、跳舞数字人,还有很多大v自己已经不出镜了,主要从事幕后文案工作,展现在前台的是其一比一复刻的数字人。总之,未来直播行业将会被数字人技术所颠覆。
1.2 文生视频(Text-to-Video)
文生视频是基于人工智能的生成技术,能够根据文字描述自动生成视频内容。这项技术可能会给创作和营销等领域带来革命性影响:
- 内容创作:文生视频技术使得创作者无需专业视频制作能力,依靠简单的文本描述就能生成高度匹配的短视频、广告、教育内容等。
- 个性化视频广告:品牌可以根据用户的兴趣、需求、历史行为等数据,自动生成个性化的广告视频。想象一下,品牌广告可以根据不同观众生成定制化的内容,极大提高转化率。
- 社交媒体内容生产:社交平台的内容创作者可以利用文生视频技术快速制作视频,无需花费大量时间进行拍摄和编辑,从而降低内容生产门槛,激发创作热情。
最近关注到央视频推出的悟空系列视频,已经开始全面采用aigc技术,一定程度上对故事线、人物形象一致性进行了优化处理,整体视觉效果还是挺惊艳的,感兴趣可以关注其公众号。未来bilibili上可能会出现大量的aigc视频,特别是漫画态视频的制作成本会大幅降低。能遇见插画师工作也将会被取代。
1.3 图生视频(Image-to-Video)
图生视频是基于图像内容生成连续视频的技术。
- 动画制作和影视制作:通过将静态图像转化为动态视频,可以大幅降低动画制作的成本和时间。这对于电影、动画短片以及广告等领域都有巨大意义。
- 虚拟现实(VR)和增强现实(AR):图生视频技术能在VR和AR场景中带来更加沉浸式的体验,用户可以从静态图像开始,逐步演绎出真实的动态场景。
- AI生成创意内容:图生视频的技术可以帮助艺术家和创意人员将手绘图像、概念设计或图像素材转化为动态视频,提升创作的效率和质量。
2. 数字人生成实践
我们将会使用D-ID【1】来进行首次数字人的尝试。目前口播类的数字人,基本上还是以口型同步为主。在D-ID,我们只需要上传一张图片外加一段文案或者外加一段语音,即可完成一个数字人视频的创建。
2.1 准备美女图片
首先我们从网上(google)随便下载一张美女图片(如有侵权请联系删除):
2.2 准备音频或者文案
然后选择一个素人配音网站【2】上随便选择一段女生音频,这里选择的是康美美的有机生活旁白音频。如果只想免费体验,可以先用iphone录音下来,文件格式为w4a。然后访问tinywow【3】,将w4a视频转化成mp3格式。tinywow功能很多,支持各类格式的互转。d-id当然也可以支持直接录制你自己的声音。
另外也可以选择配置文案,使用大模型进行文案的生成。然后采用系统自带的数字人语音进行发音。
tinywow界面:
2.3 制作数字人
有了上述的素材,就可以开始制作数字人。
首先注册,会给你20积分。每制作一个30s以内的视频,花费2个积分。
点击创建视频,然后选择标准图片:
配置数字人的一些参数:
配置音频
选择背景:
点击制作:
制作速度很快,等个十几秒种就能生成:
2.4 效果
数字人视频1
注:本文主要是简单实践,后续会持续做一些数字人原理的介绍。
3. 参考材料
【1】D-ID | The #1 Choice for AI Generated Video Creation Platform