自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 BYOL-A:自监督学习通用音频表征

BYOL-A

2022-05-07 08:48:47 703 2

原创 声纹克隆:Self supervised learning for robust voice cloning

使用自监督特征和一大堆数据增强来实现声纹克隆

2022-05-06 10:03:20 310

原创 【ECAPA_TDNN 下 】代码和论文细节分析

ECAPA_TDNN代码和论文细节分析一、数据部分二、网络结构三、损失函数四、训练指标来源:INTERSPEECH 2020机构:比利时根特大学论文地址:源码地址:论文阅读博客:ECAPA_TDNN 上一、数据部分数据集:Voxceleb2 5994个说话人数据增强:每个话语生成6个额外的样本(1) 结合MUSAN(嘈杂的人声,噪声)数据集提供的RIR数据集(混响)生成三个。(2) 利用Sox (tempo up, tempo down)和ffmpeg (alternating opu

2022-04-21 15:31:11 6960 3

原创 VOCBENCH声码器评价基准

VOCBENCHFacebook在2021年发表的论文,为了解决vocoder评价过程中变量不同而导致的难以评价的问题。

2022-04-15 13:43:16 2305

原创 Parallel WaveGan论文和代码笔记

PARALLEL WAVEGAN论文和代码结合笔记

2022-04-14 15:25:31 1009

原创 librosa相关error记录(持续记录)

使用的librosa版本是0.6.1。根据librosa文档可知,inverse只有在0.8.1版本上才有,将librosa升下级就好了。

2021-12-23 18:47:55 815

原创 【ECAPA-TDNN 上】论文阅读

论文粗读

2021-11-25 13:19:35 5904 3

原创 《算法图解》学习笔记

《算法图解》学习笔记 第一章 算法简介(二分查找,大O表示法)第二章 选择排序(数组和链表,选择排序)第三章 递归(递归,栈)第一节 递归第二节 栈第四章 快速排序(分而治之,快速排序,合并算法)第一节 分而治之(divide and conquer,递归式问题解决方法)第二节 快速排序(一种分而治之的算法)第三节 合并算法第五章 散列表第一节 散列函数第二节 应用案例第三节 冲突(collisi...

2020-02-02 20:33:29 303

原创 Finging tiny faces论文阅读笔记

《Finding Tiny Faces》论文阅读笔记 基础知识CNN(卷积神经网络)Resnet(深度残差学习网络)NMS(非极大值抑制)论文翻译(粗翻)摘要介绍Multi-tasking modeling of scalesHow to generalize pre-trained networks?How best to encode context?Our contribution相关工作尺...

2018-11-19 16:25:15 771

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除