合成基础
林林宋
不要急,不要慌,知识总是一点点积累起来的
展开
-
TTS前端
文章目录讲的很好的博客segment_and_postag:词性预测讲的很好的博客深度解读 TTS 技术的原理及挑战segment_and_postag:词性预测首先准备数据,分析标准文本中得到训练数据(1)查表,得到每个汉字/标点符号的数字序列号;(2)将标注词性转成词性的数字序列号;模型loss选用的是CRF(Conditional Random Field),model/CRF.py 类似于训练一个语言模型;...原创 2021-03-19 18:09:43 · 588 阅读 · 0 评论 -
merlin笔记
文章目录1. lab文件1. lab文件编写格式-An example of context-dependent label format for HMM-based speech synthesis in Englishslt_arctic_full_data/merlin_baseline_practice/duration_data/label_phone_align/ 0 1750000 x^x-sil+sil=w@x_x/A:0_0_0/B:x-x-x@x-x&x-x#x-x$x-原创 2020-09-23 21:42:48 · 161 阅读 · 0 评论 -
Merlin
melin的简要说明手册以及相关链接https://mtts.readthedocs.io/zh_CN/latest/merlin.html#id1merlin的官方GitHubhttps://github.com/CSTR-Edinburgh/merlinmerlin官方用户手册https://cstr-edinburgh.github.io/merlin/...原创 2019-04-05 10:08:29 · 378 阅读 · 0 评论 -
声纹识别GMM-UBM
背景: 说话人识别过程主要有三个模块,分别为:特征提取,模型训练以及模式匹配与判决。训练模块的内容是:从说话人提供的若干语音中 提取能反映个性的特征,并为其建立说话人模型,等待识别模块调用;识别模块的内容是:提取 待测语音特征并判断待测语音的身份。 GMM(高斯混合模型)–用多个高斯概率密度函数的加权可以平滑的逼近任意形状的概率密度函数,对实际数据有极强的表现力。GMM规模越庞大,表征力越强...原创 2019-04-06 19:31:32 · 2643 阅读 · 1 评论