- 博客(14)
- 收藏
- 关注
原创 TTS的发展:传统的TTS与基于深度学习的TTS
语音合成(Text-to-Speech,TTS)的历史可以追溯到很久以前。自18世纪以来,人们就想通过各种方法模拟人类发声的原理。随着深度学习技术的发展,端到端(End-to-End)的TTS系统逐渐崛起,这种系统简化了整个架构,并使得训练和生成过程更加一致。
2023-10-12 10:43:54
724
翻译 换脸综述翻译-Face swap综述(摘自SCI)
这篇文章综述简要介绍了换脸深度伪造技术的概念、背景及实现方法。希望这些信息能够帮助你更好地了解这一计算机视觉领域的研究方向。
2023-09-21 11:55:02
698
1
原创 bark与tortoise
由于深度学习和生成建模的最新改进,文本转语音 (TTS) 技术取得了快速发展。领先的两个模型是和。两者都利用变压器和扩散模型等尖端技术从文本中合成听起来令人惊叹的自然语音。对于构建语音产品的工程师和创始人来说,考虑到这些新系统的功能,选择正确的 TTS 模型现在是一项复杂的工作。虽然 Bark 和 Tortoise 有相似的最终目标,但它们的基本方法却截然不同。探索音频的新生成前沿,理解这些模型都是成功的关键。
2023-09-20 21:22:02
544
原创 《流畅的Python》学习笔记-第二章 列表推导式和生成器(三)
生成器(Generator)是 Python 中一种特殊的迭代器(Iterator),它能够在迭代过程中动态产生值,这可以有效地节省内存。列表推导式(List Comprehension)是一种简洁的生成列表的方法,它使用一条简洁的表达式来生成一个新的列表。笛卡尔积(Cartesian Product)是集合论中的一个概念,表示两个或多个集合中的元素的所有可能组合。函数,也称为匿名函数或拉姆达表达式,是 Python 中一种简洁的创建小型、临时函数的方法。函数用于对可迭代对象的每个元素应用指定的函数。
2023-09-19 11:19:13
123
原创 (Tortoise)Better speech synthesis through scaling
近年来,自回归变压器和ddpms的应用彻底改变了图像生成领域。这些方法将图像生成的过程建模为逐步的概率过程,并利用大量的计算和数据来学习图像分布。这种提高性能的方法不必局限于图像。本文描述了一种将图像生成领域的进步应用于语音合成的方法。结果是 TorToise - 一种富有表现力的多语音文本到语音系统。
2023-09-12 16:51:24
480
原创 《流畅的Python》学习笔记-第一章python的数据类型(一)
流畅的Python》(Fluent Python)是一本由Luciano Ramalho编写的Python编程书籍。这本书不仅介绍了Python的基本语法和特性,还探讨了Python中的高级概念、最佳实践和一些常用的设计模式。我将从2023年9月1日起更新学习这本书的一些笔记,本人基础较差所以学习起来会比较慢,内容也会比较详细~
2023-09-10 21:19:37
67
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人