任务
1. 从0实现一个vc系统【假期14天最低的flag】
2. 找段时间把那篇博士论文看了。
(2. [公司] fastsvc,实现一个asr-tts pipeline的、稳定的vc系统,1月22日周五前确定并搭建完基本框架。)
3. [icassp2021] introduction分为两部分:introduction + prior work;1.29周五放到arxiv上
4. [speechflow-related] 设计实验,确定之后的实验思路。
5. [看论文] 每日更新➕之前攒下的
6. [工程能力] 与任务2相结合,多看一些github代码
9. [公司] M2VoC的技术report
10. 把nus的数据传到公司服务器,用baseline合成试一下;把libritts的train-clean-360加入训练数据,因为有2456个speaker,585个小时。
今日 TODO
1. 分发数据下载脚本
2. page记录不同实验的结果,除了网页现有的结果(音频+component removed)还要加一些wer,pitch曲线等;还要对groundtruth做mos评分
3. decoder换成attention-based的decoder,几个序列直接拼接加起来;transformer:为了建模几百帧(序列较长,lstm可能无法handle)
4. 加一些训练数据,增加说话人
5. 讨论M2VoC的技术report咋写
6. hierarchical representation learning的相关文献
7. 写一个批量合成的脚本,批量合成多个实验
8. 多卡的脚本