VAD实现 (二) --- 数据预处理

在用VAD算法确定静音和语音数据的开始和起止点之前,需要对语音数据进行处理,然后再计算语音数据的开始和起止点,这个过程称为数据的预处理,有些VAD算法是基于短时能量和过零率实现的,并不进行预处理操作,但实验表明,对数据进行预处理之后的效果要比不进行预处理的效果好。这里,对数据进行去除直流和加窗两个预处理。

一,去除直流

至少有这几个理由,要求我们去除直流。

  1. 直流,是频域的慢变成分,一般都是因为信号采集过程中仪器所致。
  2. 如果需要进行频谱分析,那么因为直流的频谱泄漏,会严重影响低频谱的分析。
  3. 直流一般不随时间变化,不反应信号的趋性。
去除直接代码如下:
float  new_last_data ,last_data ; // 上次计算的去除直流之后和之前的值。
float *remove_dc(short *data,int frame_size){

	float in0 =0.0 ,of0 = 0.0 ;

	float *tf = new float[frame_size];
	for (int i=0; i < frame_size; i++){

		tf[i] = in0 = (float)(data[i]);

		tf[i] = in0 - last_data + 0.9997 * new_last_data;  // 这里所采用的去除直流公式:s_new(n) = s_old(n)-s_old(n-1)+0.9997*s_new(n-1)
		last_data = in0;
		new_last_data = of0 = tf[i];
	}
	return tf;
}

二,加窗
加窗的作用就更明显了,见 语音信号的加窗处理
float *hamming(short *data,int frame_size){

	float *tf = new float[frame_size];

	float a = 6.28318530717959 / (frame_size - 1); // 2 * PI = 6.28318530717959

	for (int i=0; i< frame_size;i++){
		tf[i] = (float)(data[i]);
		tf[i] *= (0.54 - 0.46 * cos(a*i)); //ω(n) =0.54-0.46cos[2πn/(N-1)]
	}
	return tf;
}



  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值