自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

twj625593616的博客

记录自己学习tensorflow处理音频信号等相关知识

  • 博客(3)
  • 收藏
  • 关注

原创 shuffle函数打乱(images, labels)

当提取得到相应的文件(特征)及其标签后,我们需要将他们打乱顺序。 尝试了两种方法 一: 当每个例子的标签为一个多维向量时 例(1,0,0)时 采用以下方法 image_list = wav # 或者 image_list = np.arrary(wav) label_list = label # 或者 label_list = np.arrary(label) labeled_examp

2017-12-22 16:55:24 1796

原创 tensorflow训练神经网络-提取MFCC特征

https://my.oschina.net/zzw922cn/blog/544398 这里原作者给出了怎么提取MFCC及其一阶二阶系数,代码也非常详细。 但是目前已经有python_speech_features这个模块了, 可以 pip install python_speech_features 安装 这个模块下面有mfcc,delta等特征提取方便了很多哦

2017-12-20 18:08:19 4669 3

转载 理解-MFCC梅尔倒谱系数

MFCC梅尔倒谱系数是说话人识别、语音识别中最为常用的特征。我曾经对这个特征困惑了很久,包括为什么步骤中要取对数,为什么要最后一步要做DCT等等,以下将把我的理解记录下来,我找到的参考文献中最有价值的要数【1】了。是CUM一个教授做的PPT。 整个流程如下: 时域的波形图如下 图1. 时域波形图 第一步 获得语谱图,语谱图是一个非常

2017-12-20 18:02:54 2650 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除