算法
文章平均质量分 72
本专栏主要是关于算法类文章,推荐系统、自然语言、图神经网络等算法。
饱学猿
这个作者很懒,什么都没留下…
展开
-
AI数字人主播技术实现Wav2Lip【详细记录】
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核心都是人物口型与音频中的语音唇形同步)。主要通过将两个不相关的人的视频、音频,采用Wav2Lip技术,最终得到一个完整的视频文件,且视频的人物口型与音频内容一致。举例:小红的语音、加上小花的自拍视频,融合为一个最终的视频;那么小红在发出“啊”声音的时候,小花的嘴应该是张开的,以下是一张效果图),本文第四部分有完整的效果评测视频!Wav2Lip模型、代码、教程免费直接下载原创 2023-06-01 07:38:06 · 1663 阅读 · 1 评论 -
关于attention机制,什么是注意力机制?
背景人类在对外界事物的观察或者进行文章阅读,例如对一张图片,或者看网页的查看,或对一篇文章时进行阅读,人双眼的注意力都会比较倾向观察或者阅读某些重要的局部信息,并把不同区域的局部信息进行整合起来,从而快速建立起对被观察事物或者被阅读文章的整体概览。所以attention注意力机制就是对待处理的图片、文本等数据的局部信息给与不同的权重,从而实现某种任务。所以attention是一种数据处理方法,可以理解为局部信息的权值。Attention Mechanism最早被应用于图像领域,该思想于一九九几年被提原创 2021-07-03 21:49:47 · 157 阅读 · 0 评论