研二-Maybe
ruclion
天上一日,地下十年
展开
-
DevilFruit: Vocoder之LJSpeech训练的WaveGlow
目录LJS_WaveGlow用法bash脚本文档: 模型来源LJS_WaveGlow用法bash脚本文档: 模型来源原创 2019-11-23 18:01:48 · 634 阅读 · 1 评论 -
Maybe数据集ObscureMoon(闭月)
构建数据集思路1.覆盖尽量多的"东西"."东西"可能是字, 拼音, 音节, 需要请教.2.详细了解录音环境, 老师的倾向. 进行传统语音信号统计.3.使用教育下慢音时, 如何设计语料.4.额外思考如何使用学习强国中标准的文章版TTS数据.构建TTS标准数据集1.建立文件夹Maybe_ObscureMoon2.解压文件夹zhaodan_2200.zip把解压出来的文件都cp到May...原创 2019-11-16 17:05:52 · 265 阅读 · 3 评论 -
Fast Speech,同时关注可控制语速.
在Monster上.先跑通GitHubunzip ali…zip先跳过pre data LJ, 明天和标贝的一起准备.直接都是用pre-model:前两个gdown百度网盘:wget -c --referer=https://pan.baidu.com/s/1by3-8t3A6uihK8K9IFZ7rg -O Baidu.thing "百度云实际下载地址"...原创 2019-11-14 22:20:57 · 1033 阅读 · 1 评论 -
Tacotron-2-voiceEncodeRnn-transferLearning(CorentinJ/Real-Time-Voice-Cloning)初始化
先跑通pre-train1.pip install -r requirements.txt需要去掉tensorflow那块, 我们lab10上的不叫gpu2.下载googleDrive中的文件.https://stackoverflow.com/questions/25010369/wget-curl-large-file-from-google-drive...原创 2019-11-14 21:29:54 · 1164 阅读 · 1 评论 -
Tactron-1-car20-LDE初始化
先跑通LJSpeech1.v100-monsterLJdata在外面, 更改datasets/LJ/prepare中的basedir.2.路径和模块问题import sysimport os#print(sys.path)#print(os.getcwd())sys.path.append(os.getcwd())3.关注LJSPeech的|标准化, 在已有实验是不是错误的.4...原创 2019-11-06 21:36:20 · 477 阅读 · 0 评论 -
Tacotron-1严格复现CUHK-Mix-Language论文
We clip gradients when their global norm ex-ceeds 1 and use parallel-mode monotonic attention with initial en-ergy function scalar bias set to -1.https://www.tensorflow.org/versions/r1.15/api_docs/py...原创 2019-11-01 14:48:18 · 284 阅读 · 0 评论 -
研究英伟达Tacotron-2的精度潜力
AMP精读问题单核训练WaveGlow效果最好. 为什么?复现单核WaveGlow用Biao-Bei First版本.先跑跑看看amp和DDP的情况.git版本NV_GPU='7' nvidia-docker run --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 -it --rm --ipc=host -v $PWD...原创 2019-10-25 16:22:05 · 569 阅读 · 0 评论 -
中文语音合成综合评测一(可懂度)
可懂度描述为什么mel而不用:Tacotron-2The inputs to WaveNet (linguistic features, predicted log fundamental frequency(F0), and phoneme durations)原创 2019-10-21 16:32:21 · 2005 阅读 · 0 评论 -
语音展示Demo
目录Github Pages实例仿CUHKGithub Pages实例仿CUHKhttps://csttsdemo.github.io/原创 2019-10-18 17:39:00 · 381 阅读 · 0 评论 -
Pytorch的ckpt的全面恢复
继续训练完全恢复模型参数model.load_dict学习率迭代轮数opt参数原创 2019-10-18 17:37:40 · 3771 阅读 · 0 评论 -
Tacotron2 NVIDIA版本使用Biao-Bei数据集
目录代码版本尚未补充完整!!!预处理数据bash脚本'/r'错误仿LJS预处理提取mel启动docker训练合成WaveGlow训练接着ckpt训练代码版本https://git.maybe.io/russell19/tacotron-2-nvidia2743077a94e53b71c5fad193a880a3f2d169e637尚未补充完整!!!预处理数据bash脚本'/r’错误...原创 2019-10-18 17:37:01 · 1688 阅读 · 1 评论 -
Tacotron2 NVIDIA版本优化停顿问题之Biao-Bei数据PhonePrssCrystal
目录尚未补充完整!!!预处理数据bash脚本'/r'错误仿LJS预处理提取mel改代码启动docker训练合成第一次实验失败--更正先测试问题问题1问题2问题3尚未补充完整!!!预处理数据bash脚本'/r’错误sed -i 's/\r$//' filename整个文件夹for i in *;do if [[ -f $i ]]; then sed仿LJS预处理下载, 解压, 重采...原创 2019-10-17 15:05:21 · 1030 阅读 · 1 评论 -
基于DNN的韵律结构预测
目录Crystal分词与词性标贝数据师兄论文字典论文Crystal分词与词性http://thulac.thunlp.org/标贝数据https://www.data-baker.com/open_source.html师兄论文https://drive.google.com/open?id=1rqxEx0WhBl4EY6g69KkdkhtTvHvNPIcv字典论文Boostin...原创 2019-10-16 20:25:01 · 569 阅读 · 0 评论 -
Pycharm为核心在构建服务器端深度学习语音合成程序时的配置和技巧
目录服务器端程序交互项目映射相关1. 简介2. Pycharm远程映射配置编辑器相关1. 代码提示版本控制服务器端程序交互项目映射相关1. 简介把远程的项目映射到本地, 并且保证本地更改后, 一定能够上传到远端. 但有如下隐患:假设不直接修改远端代码./ 其实也可以尝试单独修改远端, 看能不能(自动)下载同步.首先写代码前确保先把remote down下来.修改代码后, 设置为C...原创 2019-10-11 23:04:22 · 254 阅读 · 0 评论 -
尝试nvidia的Tacotron-2和waveglow的结合, 并且着重考虑多GPU以及inference时的性能.
https://ngc.nvidia.com/catalog/model-scripts/nvidia:tacotron_2_and_waveglow_for_pytorchhttps://ngc.nvidia.com/catalog/model-scripts/nvidia:tacotron_2_and_waveglow_for_pytorch/quickStartGuidehttps:...原创 2019-10-04 18:04:04 · 1392 阅读 · 0 评论 -
10月份语音合成任务安排: 商业化的普通话合成 (质量, 速度, 准确度, 韵律)
-1.0 首先趁着国庆节把9月份的任务完成, 快速整理, 难的或者繁琐的作为10月份任务之一, 但不再拓展, 即使拓展, 也只是先记下来, 后来发现还是太多了, 记下来的在下午去完成, 上午8到12点学习新的.复现两篇论文, 结构实现细节进行说明, 训练步数+batch也标记, 并且以网页形式做出对比, 尤其是口音clone, 模仿着论文分析, 画出表格和图像 (如embedding vec...原创 2019-10-04 19:56:23 · 343 阅读 · 0 评论 -
FastSpeech复现, 以及自己线段树, 分块的想法.
原创 2019-10-04 20:09:28 · 649 阅读 · 2 评论 -
复现两篇论文, 结构实现细节进行说明.代码备份, 报告完成并备份.
Google: Voice clone and code-switching cross multi-language1.再仔细读一遍google论文中的language id和speaker id送入Decoder大结构的细节.目前用法可能比较弱, 使得音质不好, 或者口音clone不好, 但如没有说明, 则目前版本可以代表复现版本, 再加上另一篇(好多处加结构的对比试验), 可以...原创 2019-10-06 11:03:34 · 1025 阅读 · 0 评论 -
接口: Phoneme的放出no-ref-no-vae/mix-phoneme版本的, 只要中文声音
1. c++编译并使用.sog++ demo.cpp CrystalDll.so -o mainexport LD_LIBRARY_PATH="./"./main2. 对接CrystalTTS的边界情况和标贝数据的边界情况以及声韵母统一.CrystalTTS:这是个测试,有没有装你好啊汪仔。zh-e4|sh-iy4|g-e5|@c-e4|sh-iy4|@。iou3|m-...原创 2019-10-08 17:32:07 · 353 阅读 · 0 评论 -
搭建基于django的网页/APT用来迭代和展示TTS
https://cloud.tencent.com/developer/article/1483982https://www.cnblogs.com/LuckyZLi/p/9832590.htmlhttps://www.runoob.com/http/http-content-type.htmlsettings中必须要是大写https://www.runoob.com/python...原创 2019-10-02 11:26:38 · 132 阅读 · 0 评论