语音信号处理
课设代码暂存
My heart will go ~~
我懂你的孤独,也懂我的孤独。
展开
-
【一】从.WAV文件中提取语音的fbank特征
本文的代码的主要作用:截取声音文件的前3.5s,预加重(增大高频部分幅度),分帧(帧长25ms,步长10ms),加窗(汉明窗),FFT(计算的512点的),梅尔滤波器(32维的)最后画图显示代码效果。每部分的参数都可以进行修改,按照自己的需求进行即可。import numpy as npfrom scipy.io import wavfilefrom scipy.fftpack import dctimport warningswarnings.filterwarnings('ignore')原创 2022-03-21 13:48:29 · 813 阅读 · 0 评论 -
【无标题】
网上抄来的代码语音预处理代码1function [x1,x2] = vad(x)%语音活动检测函数%幅度归一化到[-1,1]x = double(x);x = x / max(abs(x));%常数设置FrameLen = 240;%帧长FrameInc = 80;%步长amp1 = 10;%预先设定能量门限amp2 = 2;zcr1 = 10;%预先设定过零率zcr2 = 5;maxsilence = 8; % 6*10ms = 30msminlen = 15原创 2022-01-14 21:46:11 · 1783 阅读 · 0 评论