![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音转换
文章平均质量分 87
BarbaraChow
关注语音 & 语言
展开
-
语音质量评价方法之MOS
在语音增强、语音合成、语音转换、声音转换、语音克隆、语音修复等等领域,常常要对输出的语音进行评价。对语音的质量评价一般关注两个方面,即主观评价和客观评价。主观评价就是人凭借听觉感受对语音进行打分,客观评价比较广泛,有的是通过计算输出语音与目标语音之间的声学参数之间的差异来衡量输出语音的质量;有的是依靠仪器测试响度、频率响应、灵敏度等指标;有的依靠模型和算法,模拟人工打分。注:这些评价方法并不都是相互独立的,如:F0 MSE、F0RMSE是计算最小均方误差和最小均方根误差。有一定的相似性。原创 2024-06-17 16:27:21 · 1099 阅读 · 0 评论 -
基频建模方法总结
语音合成领域需要对基频进行建模,具体到文语转换TTS、语音转换VC、情感语音转换EVC领域等。原创 2023-05-03 22:36:02 · 739 阅读 · 0 评论 -
情感语音转换学习
如何描述和表示情感语音?情感可以用分类来描述或维度表示。对于表示情绪的标签,情绪类别方法是表示情绪最直接的方法。最著名的分类方法之一是Ekman的六种基本情绪理论,将情绪分为六个离散的类别,即愤怒、厌恶、恐惧、快乐、悲伤和惊讶,在许多情绪语音合成研究中被采用。然而,这种离散的表示并不寻求模拟人类情感中的微妙差异来控制渲染语音。另一种方法是模拟情绪表达的物理特性。一个例子是罗素的环状模型,由觉醒、效价和支配性定义。原创 2023-03-30 11:27:27 · 1374 阅读 · 0 评论 -
语音转换之CycleGan-VC2:原理与实战
非平行语音转换CycleGAN原创 2022-12-30 16:28:57 · 3693 阅读 · 10 评论 -
学习笔记:基于GMM的语音转换(超详细)
语音转换(Voice Conversion, VC)文语转换(Text to Speech, TTS)语音生成(Voice Generation, VG)今天主要学习语音转换VC任务。原创 2022-09-02 17:57:44 · 2085 阅读 · 2 评论 -
WSOLA波形相似叠加算法
WSOLA(Waveform similarity Overlap_Add)算法波形相似叠加算法主要功能:对语音进行变调,且语速不变。1. 语音合成从任务分类角度:声音转换(Voice Conversion,VC)文本-语音转换(Text to Speech, TTS)语音生成(Voice Generation,VG)从技术分类角度: 波形合成法(波形编码器)、参数合成法(声码器)、规则合成法(ps.与语音通信中的编解码器原理相同,区别一个是信道送来的参数,一个是从分析变换得到的参数)从合转载 2021-04-12 19:10:51 · 3770 阅读 · 1 评论 -
男女声语音转换
基于GMM的男女声语音转换男女声基本区别男女声主要区别在于男女声基音频率(pitch frequency)的高低。一般女声的音调比男声的音调高,这种不同主要是反应在基音频率(pitch frequency)上。一般女声的基音频率高于男声,常见的男女声基音频率大致分布范围如下图所示。提取基音频率比较常用的方法就是倒谱(cepstrum)。声音信号具有短时平稳性,我们认为在10~50ms的数据长度上声音信号是平稳信号,所以可以分帧然后用平稳信号的处理方法进行处理。首先就是分帧操作(这里取40ms帧原创 2020-11-14 22:16:48 · 6735 阅读 · 0 评论 -
语音转换方法概述
常见语音转换方法1.矢量量化法(Vector Quantization,VQ)Abe等人最早提出了矢量量化算法,将语音特征信号以帧作为划分,然后求出对应帧之间的关系,这个关系可以由一个矩阵进行表示。其基本原理如图所示:在训练阶段首先将语音分成若干个独立的帧(基于矢量量化对语音分帧量化),提取每一帧的参数矢量;然后基于DTW将对应的语音帧对齐。采用柱状统计图表示两端语音之间映射关系,建立映射码数H,H为M×M的矩阵。柱状图的统计值即为转换过程中目标语音矢量对应的加权系数,也就是矢量量化法中的映射码书。转载 2020-11-02 16:51:40 · 3772 阅读 · 0 评论 -
语音转换概述
语音转换概述一、概念指将一个人(源说话人)的声音个性化特征(如频谱、韵律等)通过“修改变换”,使之听起来像另外一个人(目标说话人)的声音,同时保持说话内容信息不变。广义上把改变语音中说话人个性特征的语音处理技术统称为语音转换。广义的语音转换可分为非特定人语音转换和特定人语音转换。二、基本原理主要个性特征参数:声道谱,共振峰频率,基音频率等。训练:特征提取,映射,模型训练转换:待转换源语音特征提取,映射,用转换模型转换,将转换后特征语音合成一般,一个完整的语音转换方案包括:反映声源特性的转载 2020-10-12 17:58:21 · 3207 阅读 · 0 评论