崔西的梅尔之旅-CSDN博客

原创声纹克隆：Self supervised learning for robust voice cloning

使用自监督特征和一大堆数据增强来实现声纹克隆

2022-05-06 10:03:20 565

ECAPA_TDNN代码和论文细节分析一、数据部分二、网络结构三、损失函数四、训练指标来源：INTERSPEECH 2020机构：比利时根特大学论文地址：源码地址：论文阅读博客：ECAPA_TDNN 上一、数据部分数据集：Voxceleb2 5994个说话人数据增强：每个话语生成6个额外的样本（1）结合MUSAN（嘈杂的人声，噪声）数据集提供的RIR数据集（混响）生成三个。（2）利用Sox (tempo up, tempo down)和ffmpeg (alternating opu

2022-04-21 15:31:11 7939 4

原创 VOCBENCH声码器评价基准

VOCBENCHFacebook在2021年发表的论文，为了解决vocoder评价过程中变量不同而导致的难以评价的问题。

2022-04-15 13:43:16 2482

原创 Parallel WaveGan论文和代码笔记

PARALLEL WAVEGAN论文和代码结合笔记

2022-04-14 15:25:31 1627

原创 librosa相关error记录（持续记录）

使用的librosa版本是0.6.1。根据librosa文档可知，inverse只有在0.8.1版本上才有，将librosa升下级就好了。

2021-12-23 18:47:55 1139 1

原创【ECAPA-TDNN 上】论文阅读

论文粗读

2021-11-25 13:19:35 6773 4

原创《算法图解》学习笔记

《算法图解》学习笔记第一章算法简介（二分查找，大O表示法）第二章选择排序（数组和链表，选择排序）第三章递归（递归，栈）第一节递归第二节栈第四章快速排序（分而治之，快速排序，合并算法）第一节分而治之（divide and conquer，递归式问题解决方法）第二节快速排序（一种分而治之的算法）第三节合并算法第五章散列表第一节散列函数第二节应用案例第三节冲突(collisi...

2020-02-02 20:33:29 673

原创 Finging tiny faces论文阅读笔记

《Finding Tiny Faces》论文阅读笔记基础知识CNN(卷积神经网络)Resnet（深度残差学习网络）NMS（非极大值抑制）论文翻译（粗翻）摘要介绍Multi-tasking modeling of scalesHow to generalize pre-trained networks?How best to encode context?Our contribution相关工作尺...

2018-11-19 16:25:15 875