虚拟数字人及AI相关应用分享

一、虚拟数字人

1、简介

        虚拟数字人可分为基础类和仿真智能类。可用于直播的,一般是仿真智能类;基础类动作缓慢,体验差,很容易被直播平台封号。

        目前各大短视频平台上介绍的数字人,出于营销目的,有夸大宣传的情况。很多声称几百元领回一个数字人,大多是使用提前录制或生成的视频,而非通过建模学习的数字人,更无法进行人机对话。

        仿真写实类数字人,不但可以预测嘴唇的动作,还可以用文字合成语音来表达,整个虚拟数字人的面容、身体、声音、动作生成均由AI实现,具有真人质感、辨识度高、互动性强的特点。数字人形象分为标准定制两种。其中定制形象可根据真人比例制作,包括动作和声音学习等。

        由于数字人全套软硬件设备等投入费用较高,目前市面上流行的玩法,初期找服务商购买数字人服务,降低运营成本。等到测试数字人直播结果适合自己,且达到理想的投入产出比后,再考虑搭建全套的数字人配套设施。

2、场景及应用

        可用于短视频直播。短视频可用于视频号中企业形象或产品宣传;直播主要用于带货,数字人直播本质只是一种工具,它能解决效率问题,但并不能很好地解决流量问题

        目前市面上的数字人直播,都是用于辅助形为,比如将数字人用于流量较差的深夜时段直播,晚间黄金时间段仍然由真人主播进行带货讲解。

        直播需要通过电脑端数字人直播软件来实现,提前设置好直播间常见问题和答案,可以通过捕捉关键词模式自动回答问题。数字人开播方式:
(1)文本驱动,输出声音为AI声音,需提前编辑好直播文本;
(2)音频驱动,输出声音为真人声音,需要提前录制好声音文件;
(3)真人驱动,真人在后台说话驱动数字人口型进行直播,实时互动。

        当前各大直播平台对数字人带货的规则限制各有不同,比如美团较松、抖音平台要求最严,经常会被封号。封禁理由一般有互动回答问题不智能,影响客户体验;发现有重复数字人形象在不同商家中使用,涉嫌违规。还有一种24小时使用数字人直播,无真人在线运营等,也会被封号。

3、投入预算及费用

        目前数字人算力大模型中,百度和京东已经完成电脑端和手机安卓端的研发使用,很多数字人工厂平台也是接入他们的系统。腾讯、阿里也在数字人上有投入,主要在电脑端。

        另外,南京本地数字人原创企业中,南京硅基智能科技有限公司是最早一批做数字人,且通过自研产品取得成功的代表。该企业先后被评为国家级专精特新“小巨人”企业和南京人工智能独角兽企业。

        以下是南京硅基智能科技有限公司有关数字人的参考价格:

序号

项目

价格

定制周期

备注

1

形象克隆

8000元/年

3个工作日

包含1个形象克隆+赠送500分钟视频合成时长(有效期1年);不包含声音克隆,【用系统的AI声音】或【自己传录音】

2

声音克隆

15000元/年

5个工作日

1个声音克隆+赠送5000分钟音频合成时长(有效期1年);不包含形象克隆,还原度较高,接近真人声音,若自身带口音等,会适当存在机械感

3

数字人直播

5500元/月

内置30个免费的数字人模特选用,如需选用硅语平台其他数字人另加1999/个*年,如需定制专属形象另加8000元/个*年

4

季度直播

19800元/季

三个月直播+赠送一个数字人形象克隆名额

5

直播机

9000元

预估一次性投入,也可自行配置高配电脑。

        如果前期只尝试做数字人短视频,也可以选择第三方的AI工具,例如万兴科技的“万兴播爆”,输入文案,可一键生成“真人”营销视频。购买年度会员(998元/年),可导出360分钟的视频。

综合来看,数字人短视频和直播每年需投入至少10万元,且不包含电脑硬件、运营人员费用等。

二、AI在其他方面的应用

        AI在其他方面的应用相对较广,但大多数仍处于发展阶段,可作为文案和设计等人员的辅助工具,用于提高工作效率。离替代人工还有相当长的差距。

1、生成文案

        除了国外的ChatGPT,国内百度的“文心一言”和阿里的“通义千问”也都很成功,能够根据用户需求生成对应的策划方案稿等。中文方面,后者较ChatGPT更出色。但不管是哪类AI生成的文稿,目前来看也只能做为极好的参考资料,仍需要人工来分析、编辑加工、再创作。AI可有效节约文案工作者的时间。

2、编写程序

        主要是针对程序员编写代码方面,可根据需求自动生成相关代码,由程序员来进行二次编辑修改利用,可快速提高开发效率。

3、生成图片

        针对图形图像设计师,可根据用户需求描述,生成图像设计稿供设计师参考,开拓设计思路,节约基础设计时间。

AI生成图片的技术主要依赖于深度学习和生成对抗网络(GAN)。以下是一些常用的AI生成图片工具:

    DeepDream:由Google开发,可以将一张图片转换成类似于迷幻艺术的图像。

    StyleGAN:由NVIDIA开发,基于GAN的图像生成算法,尤其擅长生成人脸图片。

    DALL-E:由OpenAI开发,基于GAN的图像生成算法,可以根据文字描述生成各种图像。

    ArtBreeder:一款在线艺术创作平台,使用GAN算法和进化算法生成各种图像,可以通过调整参数生成不同的艺术风格。

此外还有一些设计软件,比如Pixso、Adobe Express 中的文字生成图像功能,也可以根据文字描述来生成出色的图像。

4、生成视频

        针对视频制作者(例如我们的摄影师),有些工具可以帮助他们通过输入文字内容,快速生成高质量的视频。以下列举一些软件,暂不作深入介绍。

  1. D-ID:使创作者能够生成逼真的 AI 角色;
  2. Pictory:可将文字内容转变成短视频;
  3. Deepbrain:使用文本即可生成逼真的 AI 视频;
  4. Opus Clip:利用AI将长视频调整为短视频;
  5. 万兴播爆:输入文案,一键生成“真人”营销视频;
  6. Synthesia:基于ChatGPT的文本到视频生成器

5、获客

        通过AI技术,企业可以分析客户的行为和需求,制定更加精准的营销策略,提高获客效率和质量。同时,AI还可以自动化一些重复性的获客任务,如客户数据整理、初步筛选等,从而减轻人工劳动力负担。以下是一些常见的AI获客工具:

(1)AI智能销售机器人:可模拟销售人员的行为,自动与潜在客户进行沟通、答疑和推荐产品。

(2)AI客户画像工具:可通过分析和挖掘潜在客户的行为、兴趣、需求等,构建精准客户画像。

(3)AI智能推荐系统:可根据潜在客户的历史行为、偏好和兴趣等数据,智能推荐符合其需求的产品或服务。最常见的是电商类购物网站,已经在使用。

(4)AI语音识别和语音合成工具:可以通过语音识别和语音合成技术,实现与潜在客户的语音交互,提供便捷和个性化服务。

AI获客较多应用于金融行业、零售行业(电商平台、实体店铺等)、教育行业(在线教育平台、培训机构等)、医疗行业(智能问诊等)。

        然而,AI技术并不能完全取代人工获客团队。人工获客团队在与客户沟通、建立信任关系、提供个性化服务等方面具有独特优势,这是AI技术难以替代的。此外,人工获客团队还可以根据市场变化和客户需求,灵活调整营销策略和方案,确保获客效果的最大化。

三、总结

        综上所述,有关AI应用,总结为三个方面:

(1)虚拟数字人在短视频和直播带货方面,可以给企业相应岗位的人员带来方便,节约时间,提高效率。成本和性价比需结合我们具体的需求来做评估。

(2)AI获客方面,需要结合自身的实际情况和目标,合理配置AI获客团队和人工获客团队,充分发挥两者的优势,实现获客效果的最大化。我们是否适合,与具体需求是分不开的

(3)AI生成文案、图片、视频、代码等,此类生成的结果目前仍只能作为备用参考素材,需要人工编辑加工再创作。例如我们人事部、行政部、设计部等同事,可以结合自身工作需求,利用相关AI工具提高工作效率。

讯飞AI虚拟人Java对接接口包括以下步骤: 1. 注册讯飞AI账号并创建虚拟人服务。 2. 下载讯飞AI虚拟人Java SDK并导入到项目中。 3. 配置讯飞AI虚拟人Java SDK。 4. 实现Java代码调用讯飞AI虚拟人API。 以下是一个示例代码: ``` import com.iflytek.cloud.*; import com.iflytek.cloud.util.ContactManager; import com.iflytek.cloud.util.ResourceUtil; public class Demo { private SpeechUtility speechUtility; private VoiceRecognize voiceRecognize; private VoiceSynthesize voiceSynthesize; private ContactManager contactManager; public Demo() { // 初始化语音识别、语音合成和联系人管理对象 speechUtility = SpeechUtility.createUtility(); voiceRecognize = VoiceRecognize.createRecognizer(); voiceSynthesize = VoiceSynthesize.createSynthesizer(); contactManager = ContactManager.createManager(); } public void recognize(String audioFile) { // 设置语音识别参数 voiceRecognize.setParameter(SpeechConstant.AUDIO_FORMAT, "wav"); voiceRecognize.setParameter(SpeechConstant.ASR_AUDIO_PATH, audioFile); voiceRecognize.setParameter(SpeechConstant.LANGUAGE, "zh_cn"); voiceRecognize.setParameter(SpeechConstant.ACCENT, "mandarin"); // 开始语音识别 voiceRecognize.startListening(new RecognizeListener() { @Override public void onVolumeChanged(int i) { // 语音音量变化回调 } @Override public void onBeginOfSpeech() { // 开始说话回调 } @Override public void onEndOfSpeech() { // 结束说话回调 } @Override public void onResult(RecognizerResult recognizerResult, boolean b) { // 语音识别结果回调 } @Override public void onError(SpeechError speechError) { // 语音识别错误回调 } @Override public void onEvent(int i, int i1, int i2, String s) { // 语音识别事件回调 } }); } public void synthesize(String text, String audioFile) { // 设置语音合成参数 voiceSynthesize.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan"); voiceSynthesize.setParameter(SpeechConstant.SPEED, "50"); voiceSynthesize.setParameter(SpeechConstant.VOLUME, "80"); voiceSynthesize.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); // 开始语音合成 voiceSynthesize.startSpeaking(text, new SynthesizeListener() { @Override public void onSpeakBegin() { // 开始合成回调 } @Override public void onBufferProgress(int i, int i1, int i2, String s) { // 合成进度回调 } @Override public void onSpeakPaused() { // 暂停合成回调 } @Override public void onSpeakResumed() { // 恢复合成回调 } @Override public void onSpeakProgress(int i, int i1, int i2) { // 合成进度回调 } @Override public void onCompleted(SpeechError speechError) { // 合成完成回调 } @Override public void onEvent(int i, int i1, int i2, Bundle bundle) { // 合成事件回调 } }); } public void addContact(String name, String number) { // 添加联系人 contactManager.addContact(name, number); } public void queryContact(String name) { // 查询联系人 String number = contactManager.queryContact(name); System.out.println("查询结果:" + number); } } ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值