AI应用带你玩系列之【SadTalker】

插播一条广告2024年07月08日,最新活动,先到先得
在这里插入图片描述

前段时间我刷微信视频,我无意间点开了一个,画面缓缓展开,是一幅精致的水墨画,画中人物皆是古代装束,衣袂飘飘,仿佛能闻到墨香。然而,这宁静的画面突然被打破了,画中的人物开始动了起来,他们的嘴型和面部表情生动地配合着一首现代流行歌曲《一人我饮酒醉》。我惊呆了,这究竟是怎样的魔法,能让古画中的人物如此生动地“嗨歌”?

好奇心驱使下,我深入探索,发现了一个名为“让照片说话”的算力应用。这不仅仅是一个简单的软件,它背后蕴含的是最新的AI技术——深度学习和计算机视觉的结合。这项技术能够分析图片中人物的面部特征,然后通过算法模拟出相应的嘴型和表情,再配上声音,就能创造出仿佛真人一般的动态效果。

朋友们,今天我就是要带大家一起玩一下这个应用。一起嗨起来。

首先是网址一定不要打错了。https://www.haoee.com/

每一个新注册用户,账户会有5元应用试用金额。大概能体验两款应用,每个应用体验1小时。所以要一定要选择好自己的目标。

1、注册一个账号,用手机号注册,直接绑定手机,还不容易忘记。

在这里插入图片描述

2、开心登录

在这里插入图片描述

3、点击【立即创建】

在这里插入图片描述

4、我们今天的目标应用【SadTalker】

跟我一起读一下他的简单介绍

SadTalker

Sadtalker 让照片能说话
基于深度学习的AI数字人制作工具,可以通过对照片中的人物进行动态化处理,生成具有头部运动和面部表情的数字人。
1、让照片中的人物动起来,能说话;
2、人物口唇自然流畅,宛如原生;

在这里插入图片描述

5、不要着急,先和我一起【查看详情】

在这里插入图片描述

详情页面有SadTalker的详细说明:

SadTalker是一个开源的人工智能项目,专注于情感理解和对话生成。该项目主要基于深度学习技术,理解和生成具有情感色彩的对话,并特别关注负面情绪的处理和表达。

SadTalker可以应用在以下几个方面:心理咨询助手、情感智能机器人、AI数字人制作工具,SadTalker还提供了易于使用的API接口,使得其他应用可以方便地集成其功能,如在聊天应用中实现情绪感知的自动回复。对于对AI聊天机器人、自然语言处理(NLP)或情感分析感兴趣的人来说,SadTalker是一个极具价值的学习和实践资源。

6 、从详情页面进入使用

在这里插入图片描述

7、 创建应用

在这里插入图片描述

8、 按照默认创建一个应用

在这里插入图片描述

开机中…

我们要等一会。直到应用状态变成了:运行中。如下图。

在这里插入图片描述

9、打开应用

在这里插入图片描述

SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation (CVPR 2023)

翻译:SadTaker:为风格化音频驱动的单图像会说话的人脸动画学习逼真的3D运动系数(CVPR 2023

10、首先拖动音频文件到指定的地方

在这里插入图片描述

在这里插入图片描述

11、这里需要一个图片

在这里插入图片描述

我选了个美女,做一个常规新闻播报。

请添加图片描述

12、生成看看

选项

在这里插入图片描述

点击生成
在这里插入图片描述

这里看进度

在这里插入图片描述

13、生成结果

等待的时候顺便学一些英语单词吧。

crop resize full

裁剪 调整 全文;(翻译可能有误)

Still Mode (fewer head motion, works with preprocess full)

静止模式(较少的头部运动,与预处理“完全”一起工作)

GFPGAN as Face enhancer

GFPAGAN作为人脸增强剂

batch size in generation

生成中的批量大小

face model resolution

人脸模型分辨率

新闻播报

新闻播报

顺手生成一个杜甫嗨《一人饮酒醉》

杜甫嗨

快来创意你的作品吧 。 让图片里的朋友们动起来,让我们嗨起来。

14、完整的故事是这样的

前段时间我刷微信视频,我无意间点开了一个视频,画面缓缓展开,是一幅精致的水墨画,画中人物皆是古代装束,衣袂飘飘,仿佛能闻到墨香。然而,这宁静的画面突然被打破了,画中的人物开始动了起来,他们的嘴型和面部表情生动地配合着一首现代流行歌曲《一人我饮酒醉》。我惊呆了,这究竟是怎样的魔法,能让古画中的人物如此生动地“嗨歌”?

好奇心驱使下,我深入探索,发现了一个名为“让照片说话”的算力应用。这不仅仅是一个简单的软件,它背后蕴含的是最新的AI技术——深度学习和计算机视觉的结合。这项技术能够分析图片中人物的面部特征,然后通过算法模拟出相应的嘴型和表情,再配上声音,就能创造出仿佛真人一般的动态效果。

后来我在网络上搜索了关于这个视频的生成技术,我决定尝试一下这个令人兴奋和期待的新技术——让历史人物杜普的照片开口说话。杜普,这位历史上的智者,以其深邃的思想和卓越的成就闻名于世。我想象着,如果能让他的肖像唱起现代流行歌曲,那将是一次多么有趣的跨时空对话。

我打开电脑,启动了最新的AI算力应用。这个应用利用了先进的深度学习技术和计算机视觉算法,能够分析静态图像中人物的面部结构,并模拟出自然的嘴型和表情,从而实现“让照片说话”的神奇效果。

我小心翼翼地将杜普的肖像上传到应用中,选择了他那张著名的沉思照。接着,我在应用中输入了一首现代流行歌曲的歌词,心中充满了期待和一丝紧张。应用开始工作,屏幕上出现了进度条,我目不转睛地盯着,仿佛在见证一个奇迹的诞生。

几分钟后,视频生成完毕。我深吸一口气,点击了播放。画面中的杜普缓缓地动了起来,他的嘴型和表情随着歌词的节奏变化,仿佛真的在唱歌。我惊讶地发现,他的眼神中似乎还透露出一种对现代世界的惊奇和好奇。

这一刻,我仿佛穿越了时空,与杜普进行了一次跨越千年的对话。这项技术不仅仅是一次有趣的尝试,它让我感受到了科技与人文的完美结合。我意识到,AI技术不仅仅是冷冰冰的代码,它还能以一种全新的方式连接过去与现在,让历史人物以一种前所未有的方式“活”起来。

这次技术尝试让我对AI技术的潜力有了更深的认识。它不仅能够娱乐我们,还能够教育我们,让我们以一种全新的视角去理解和感受历史。我期待着未来,这项技术能够被更广泛地应用,让更多的人能够体验到这种跨越时空的奇妙对话。

15、关注我,一起玩丰富多彩的AI应用,一起嗨起来

随着AI技术的不断进步,我们的生活正逐渐被这些智能应用所丰富和改变。从图片生成到直播换脸术,这些新颖的玩法不仅为我们带来了娱乐和乐趣,更展示了人工智能在创意表达和技术融合方面的无限潜力。

在接下来的文章中,我将带领大家一起探索这些令人兴奋的AI应用。我们将一起尝试使用先进的算法来创作独一无二的图片,体验直播换脸术带来的惊喜和欢笑。这些尝试不仅是对技术的探索,更是对未来可能性的展望。

AI技术的发展不仅仅是科技领域的进步,它正在逐步渗透到我们的日常生活中,改变我们沟通、娱乐和学习的方式。通过这些有趣的实验和应用,我们可以更直观地感受到AI技术的魅力,以及它对我们生活的深远影响。

让我们一起期待,随着AI技术的不断成熟和完善,未来会有更多创新和有趣的应用出现。我们将继续在这个充满可能性的数字世界中探索,发现更多令人惊叹的AI奇迹。敬请关注我们的后续文章,一起开启这场科技与创意的奇妙之旅。

print("一起探索AI应用,请记住网址:https://www.haoee.com/")
print("一起探索AI应用,请记住网址:https://www.haoee.com/")
print("一起探索AI应用,请记住网址:https://www.haoee.com/")

关注我,不迷路,共学习,同进步

关注我,不迷路,共学习,同进步

  • 46
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

百锦再@新空间代码工作室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值