自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Spleeter工具简单分析

源码地址:https://github.com/deezer/spleeterpytorch版本:https://github.com/generalwave/spleeter.pytorch前言    spleeter是一款基于深度学习的多音轨分离软件。其使用python3.7基于tensorflow1.15版本编写。本文给出了spleeter的pytorch版本,并将官方预训练模型转化为pytorch模型。该版本经验证效果与官方版本一致。   从功能上,目前预训练模型为2stems(分离出人声/

2020-07-14 10:03:58 11768 14

原创 男女声分类研究及应用

背景在很多业务场景下,确定发声人的性别都是很有用的。人类可以很轻松的通过一段语音确定发声者的性别,但是人的成本以及效率是比较低的。此时,假如机器可以完成这项工作的,将极大的解放人力提升效率。研究过程算法方案特征的选择使用在自动语音和说话人识别中广泛使用的MFCC特征。因为男女声的最明显的差异在音色,而音色在音频上表现为其共振峰分布。MFCC特征[1]是使用频谱包络(连接所有共振峰值点的平滑曲线)再经过基于人耳听觉实验获取到的三角滤波器组,过滤掉一些人耳不敏感的频率分量之后得到。因此,使用MFCC特征

2020-06-03 14:39:57 1673 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除