语音合成TTS
文章平均质量分 83
小白入门语音的第一个任务,以实现在端侧部署TTS模型为任务,不断学习
一个热爱学习的深度渣渣
本科软件工程,目前从事算法相关工作,欢迎志同道合的伙伴交流~
展开
-
语音合成学习(一)综述
一、资料推荐爱丁堡大学课程(全英文,有能力的推荐学习一遍):https://speech.zone/courses/speech-synthesis/TensorflowTTS(比较系统的开源项目):https://github.com/TensorSpeech/TensorFlowTTS二、基础概念介绍1、时域:波形的振幅、频率;2、频域:傅里叶变换:每个复杂的波形都可以由不同频率的正弦波组成;语谱(spectrum):描述了信号包含的频率成分和它们的幅度;语谱图(spectrogram原创 2021-12-23 15:02:19 · 9611 阅读 · 2 评论 -
Python——语音处理基础
Python——语音处理基础目标:Python对音频文件的IO处理;语音中关于音量和音响的一些计算;一、概述声音物理意义:声音是一种纵波,纵波是质点的振动方向与传播方向同轴的波。如敲锣时,锣的振动方向与波的传播方向就是一致的,所以声波是纵波。纵波是波动的一种(波动分为横波和纵波);通常对声音进行采样量化后,得到声音的"时间—振幅"信息;下图是用Adobe Audition打开一段音频数据:说明:图中上半部分为波形图,下半部分为频谱图;频谱通过对波形的傅里叶变换,把波形中的每个频率拆开原创 2021-09-03 10:40:30 · 1389 阅读 · 0 评论 -
语音合成——声学模型概述
语音合成概述文章概述:本篇文章主要介绍了语音合成的基础概念、主流声学模型的优缺点,以及语音合成前沿技术的科普;通过本篇文章的学习,可以对语音合成技术的概念以及模型的选型有一定了解;语音合成流程音素:最小的语音单位,如’普通话’这三个字是由3个音节,8个音素组成的;主要有三个阶段:前端处理——声学模型——声码器前端处理与声码器都有通用的一些方案,针对不同任务的改进点主要在声学模型部分;自回归语音合成模型主要包括:Tactotron2、Transformer TTS、Deep Voice 3原创 2021-08-24 09:43:49 · 5746 阅读 · 0 评论