MFCC
文章平均质量分 76
Yakuho
网络爬虫、深度学习、古灵精怪的需求 :)
展开
-
【Python深度学习】基于Tensorflow2.0构建CNN模型尝试分类音乐类型(二)
前情提要基于上文所说 基于Tensorflow2.0构建CNN模型尝试分类音乐类型(一) 我用tf2.0和Python3.7复现了一个基于CNN做音乐分类器、用余弦相似度评估距离的一个音乐推荐模型。下面浅略介绍一下所用到的原理。一、总体架构二、实际原理首先使用8000个平均分布的8个流派的30s时长的mp3歌曲作为训练集。每一个流派含有1000首歌曲,使用python音频解析库librosa读取音频的采样率设置为44100,MFCC的n设置为128,再将生成的一张大声谱图分割成数个128×128原创 2021-01-14 00:10:42 · 1080 阅读 · 0 评论 -
【MFCC】MFCC增量用于计算相关性
算法思想:设Maxtrix为N,J维矩阵、Size为M设Maxtrix为N, J维矩阵、Size为M设Maxtrix为N,J维矩阵、Size为MVector1是表示Matrix的第1行Vector_1 是表示Matrix的第1行Vector1是表示Matrix的第1行则:(NewVector)i=∑1≤j≤Mj∗[(vector)(i+j)−(vector)(i−j)]则:(NewVector)_i = \sum\limits_{1 \le j \le M} j*[(vector)_(i+j_原创 2020-05-19 19:23:24 · 222 阅读 · 0 评论 -
【MFCC梅尔倒频谱参数】浅谈语音特征参数MFCC提取过程
在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,简称MFCC)。根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度。从200Hz到5000Hz的语音信号对语音的清晰度影响对大。两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象称为掩蔽效应。由于原创 2020-05-04 17:17:28 · 2848 阅读 · 1 评论 -
【python_speech_features】MFCC调参用法以及参数说明
代码调用from python_speech_features import mfccmfcc_feature = mfcc(**kwargs)paramssignal:the audio signal from which to compute features.Should be an N1 array用来计算梅尔频率倒谱系数特性的音频信号。是一个N1的数组samplerat...原创 2020-05-02 21:24:44 · 5715 阅读 · 3 评论