家好,我是海文,专注于AI智能体工作流方面的知识分享,今天给大家分享的是用coze一键打造自己的口播数字人。
前言
前一段时间,我在搞数字人方面的,想用coze做一个工作流来自动生成数字人口播视频
尝试了coze里面的婵镜和飞影数字人插件,发现用这样的插件做出来的效果和直接用他们官网进行制作并没有什么特别的优势,我甚至感觉还不如直接在他们官网上使用呢
所以我就抛弃了上面的这两个方式,搭建出了一个成本更低、操作更傻瓜、效果还不错的生成数字人的工作流
实现了一键制作出数字人,即用即走!
大家可以先看看我的工具的是如何生成数字人的:
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏**退出全屏
老三的AI充电站已关注
分享视频
,时长03:09
0/0
00:00/03:09
切换到横屏模式
继续播放
进度条,百分之0
[播放](javascript:😉
00:00
/
03:09
03:09
全屏
倍速播放中
[ 0.5倍 ](javascript:😉[ 0.75倍 ](javascript:😉[ 1.0倍 ](javascript:😉[ 1.5倍 ](javascript:😉[ 2.0倍 ](javascript:😉
[ 超清 ](javascript:😉[ 流畅 ](javascript:😉
您的浏览器不支持 video 标签
继续观看
扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)
观看更多
原创
,
扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)
老三的AI充电站已关注
分享点赞在看
已同步到看一看[写下你的评论](javascript:😉
[ 视频详情 ](javascript:😉
制作出来的数字人效果如下:
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏**退出全屏
老三的AI充电站已关注
分享视频
,时长00:09
0/0
00:00/00:09
切换到横屏模式
继续播放
进度条,百分之0
[播放](javascript:😉
00:00
/
00:09
00:09
全屏
倍速播放中
[ 0.5倍 ](javascript:😉[ 0.75倍 ](javascript:😉[ 1.0倍 ](javascript:😉[ 1.5倍 ](javascript:😉[ 2.0倍 ](javascript:😉
[ 超清 ](javascript:😉[ 流畅 ](javascript:😉
您的浏览器不支持 video 标签
继续观看
扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)
观看更多
转载
,
扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)
老三的AI充电站已关注
分享点赞在看
已同步到看一看[写下你的评论](javascript:😉
[ 视频详情 ](javascript:😉
这个工具是不是制作数字人更加方便,而且效果还是在线的,如果你也感兴趣,请继续往下看吧。
接下来,我们和大家分享如何制作出这个的数字人的工作流,大家可以关注点赞收藏,后续我会继续为大家分享工作流教程。
正文
一、整体工作流如下:
二、开发思路:
- 从上传的口播文件中提取出音频的内容
- 再通过音色复刻,将输入的文案结合音频进行声音克隆
- 将克隆出来的声音加上口播视频进行制作出数字人
- 最后在视频上加上字幕
三、详细工作流分析
1、开始节点
接收应用UI传进来的口播文件和口播文案
2、音频文件提取
接收“开始节点”的口播文件,将音频提取出来
注:自制插件
3、音频内容提取
将口播文件的音频内容提取出来
4、声音克隆
结合口播的音频和“开始节点”的文案进行音色复刻,并完成声音的克隆
注:自制插件
5、数字人生成
传入“开始节点”的口播文件以及克隆出来的音频进行数字人生成
6、查询数字人
我们在这个循环体里面间隔的查询数字人是否已经生成
7、生成字幕
将生成的数字人链接传入进来生成下方带有字幕的数字人
到此为止,整个数字人的制作完成了,用这个工作流制作数字人是不是很方便的呢?
掌握以上关键步骤, 你也能轻松制作出自己的数字人! 快去亲自试试吧!
关键点分析
- 视频中展示的登录页面,我虽然没有讲,但是也是一个比较重要的地方,这个登录界面是不依赖于任何第三方的接口,纯coze就可以实现,对于想做付费的小伙伴,是一个比较不错的方案
- 声音克隆:采用的是通义千问的CosyVoice2.0,克隆出来的声音虽然达不到原声的程度,但是整体效果还是不错的
- 数字人:采用的是当下比较火的开源数字人平台heygem,对出来的口型也是非常不错
总结
我起初搭建这个数字人工具的时候,奔着两个目的来的:一是想操作方便,即傻瓜式操作,不需要任何的认证、预训练等环节,即用即走。
另外一个是要比婵镜和飞影等数字人平台的制作成本更加低廉。
登录界面是不依赖于任何第三方的接口,纯coze就可以实现,对于想做付费的小伙伴,是一个比较不错的方案
- 声音克隆:采用的是通义千问的CosyVoice2.0,克隆出来的声音虽然达不到原声的程度,但是整体效果还是不错的
- 数字人:采用的是当下比较火的开源数字人平台heygem,对出来的口型也是非常不错
总结
我起初搭建这个数字人工具的时候,奔着两个目的来的:一是想操作方便,即傻瓜式操作,不需要任何的认证、预训练等环节,即用即走。
另外一个是要比婵镜和飞影等数字人平台的制作成本更加低廉。
再者就是这个数字人可以部署在飞书上面,用手机操作就能生成口播数字人,人在外面,也能随时随地生成口播数字人视频。
大模型岗位需求
大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
掌握大模型技术你还能拥有更多可能性:
• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;
• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
零基础入门AI大模型
今天贴心为大家准备好了一系列AI大模型资源,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
有需要的小伙伴,可以点击下方链接免费领取【保证100%免费
】
1.学习路线图
如果大家想领取完整的学习路线及大模型学习资料包,可以扫下方二维码获取
👉2.大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。(篇幅有限,仅展示部分)
大模型教程
👉3.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(篇幅有限,仅展示部分,公众号内领取)
电子书
👉4.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(篇幅有限,仅展示部分,公众号内领取)
大模型面试
**因篇幅有限,仅展示部分资料,**有需要的小伙伴,可以点击下方链接免费领取【保证100%免费
】
**或扫描下方二维码领取 **