语音信号处理
课设代码暂存
My heart will go ~~
我懂你的孤独,也懂我的孤独。
展开
-
【一】从.WAV文件中提取语音的fbank特征
本文的代码的主要作用:截取声音文件的前3.5s,预加重(增大高频部分幅度),分帧(帧长25ms,步长10ms),加窗(汉明窗),FFT(计算的512点的),梅尔滤波器(32维的)最后画图显示代码效果。 每部分的参数都可以进行修改,按照自己的需求进行即可。 import numpy as np from scipy.io import wavfile from scipy.fftpack import dct import warnings warnings.filterwarnings('ignore')原创 2022-03-21 13:48:29 · 724 阅读 · 0 评论 -
【无标题】
网上抄来的代码 语音预处理 代码1 function [x1,x2] = vad(x)%语音活动检测函数 %幅度归一化到[-1,1] x = double(x); x = x / max(abs(x)); %常数设置 FrameLen = 240;%帧长 FrameInc = 80;%步长 amp1 = 10;%预先设定能量门限 amp2 = 2; zcr1 = 10;%预先设定过零率 zcr2 = 5; maxsilence = 8; % 6*10ms = 30ms minlen = 15原创 2022-01-14 21:46:11 · 1761 阅读 · 0 评论