TTS
Zero_to_zero1234
Be objective
展开
-
python包导入细节(attempted relative import beyond top-level package的原因解读)
先在讨论python导入问题时,先弄清楚几个重要概念和区别:一、什么是模块,什么是脚本(script vs module)二、命名(naming)三、不通过包导入访问一个模块四、相对导入…五、…只能用在相对导入当使用六、脚本不能包含相对导入七、解决办法感谢博主 小舔哥 :https://www.cnblogs.com/jiaxin359/p/7580375.html ...原创 2019-10-22 16:01:02 · 24273 阅读 · 2 评论 -
微软语音合成(tts)服务申请和调用
微软语音合成(tts)服务申请和调用原创 2022-08-20 23:30:59 · 13929 阅读 · 7 评论 -
Montreal Forced Aligner (MFA)安装教程及异常处理
官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html1、MFA简介Forced alignment is a technique to take an orthographic transcription of an audio file and generate a time-aligned version using a pronunciation dictionary to look up phones f原创 2021-09-25 12:45:26 · 5478 阅读 · 8 评论 -
Tacotron2讲解
参考博客:https://blog.csdn.net/whjkm/article/details/89321954#commentBoxhttps://blog.csdn.net/yunnangf/article/details/79585089github代码:https://github.com/NVIDIA/tacotron2一、模型结构模型结构上,tacotron2与tacotron基本类似,除了CBHG结构和Griffin结构上略有区别Tacotron:Tacotron2:二原创 2020-07-07 17:10:54 · 8972 阅读 · 0 评论 -
语音信号处理流程总结
一、语音合成、识别中不可避免在做语音合成、语音识别过程中,难以避免的会涉及到语音信号知识,通过对多篇博客的阅读和理解,作以下总结:二、大致流程根据 zouxy09博客 ,知道大致预处理流程如下:接下来再进一步对各个环节进行进一步说明三、预加重、分帧和加窗根据 语音加窗分帧处理四、STFT和声谱图,梅尔频谱(Mel Bank Features)与梅尔倒谱(MFCCs)根据博客:(https://blog.csdn.net/qq_28006327/article/details/591291原创 2020-06-28 14:39:34 · 5778 阅读 · 0 评论 -
python对音频文件进行重采样
一、ffmpegpip install python-ffmpeg简单代码:import ffmpegffmpeg.input('input.mp3').output('output.mp3', ar=16000).run()二、librosa库import librosa# to install librosa package# > conda install -c conda-forge librosa filename = 'ClapSound.wav'newFile原创 2020-06-08 14:09:50 · 3366 阅读 · 3 评论 -
迁移学习之Domain Adaptation
关于迁移学习的两篇文章,先简单记录一下,后面再进行补充https://chenrudan.github.io/blog/2017/12/15/domainadaptation1.htmlhttps://blog.csdn.net/weixin_37993251/article/details/89398433原创 2020-06-05 10:53:46 · 1337 阅读 · 0 评论 -
VAE全面理解
【学习笔记】生成模型——变分自编码器原创 2020-06-04 15:59:07 · 831 阅读 · 0 评论 -
pytorch报错 ConvTranspose1d object has no attribute padding_mode
‘ConvTranspose1d’ object has no attribute 'padding_mode’错误:https://github.com/NVIDIA/tacotron2/issues/182解决方法:Using torch 1.1.0.dev20190512 and waveglow_256channels.pt I was still getting this error. Following @apsears I managed to get it working. Here a原创 2020-06-04 10:25:48 · 1235 阅读 · 1 评论 -
英文TTS前端基本知识(音标、重读、语调)
一张表看懂英式音标和美式音标的差异史上最全英语口语连读、略读、断句、重音、语调等发音规则!英语音标编辑器原创 2019-12-13 11:44:40 · 1513 阅读 · 0 评论