语音的前置处理（一）

最新推荐文章于 2024-03-12 11:00:06 发布

ahyswang

最新推荐文章于 2024-03-12 11:00:06 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

文章标签： preprocessor integer float null go 测试

本文链接：https://blog.csdn.net/ahyswang/article/details/7654670

本文介绍了语音前置处理的重要性，特别是自动增益控制(AGC)在处理语音信号中的作用。文章详细阐述了使用speex开源库进行AGC处理的相关接口，包括初始化、销毁、运行等，并提供了部分AGC的实例代码。

语音在采集和传输过程中，由于语音源的差异、信道的衰减、噪声的干扰以及远近效应，导致信号幅度相差很大。所有在语音处理之前我们需要对语音数据进行前置处理，包括预处理（AGC、VAD、回音消除）、重采样和噪声抑制。

所有的代码都是基于speex开源库，具体内容可以参考http://speex.org/。

本开发手册暂时只提供AGC的接口和测试代码，其他陆续添加进来。

预处理模块包括自动增益控制、静音检测和回音消除。以下是接口函数，具体参考speex\ speex_preprocess.h。

函数名称	功能简介
speex_preprocess_state_init	创建预处理器
speex_preprocess_state_destroy	销毁预处理器
speex_preprocess_run	处理一帧数据
speex_preprocess	处理一帧数据（废弃的）
speex_preprocess_estimate_update	更新预处理器
speex_preprocess_ctl	设置和读取预处理器的参数

函数原形	SpeexPreprocessState *speex_preprocess_state_init(int frame_size, int sampling_rate);
功能	创建预处理器
参数	Frmae_size [in]每帧的大小（建议帧长为20ms） Sample_rate [in]采样率（支持8k、16k、44k）
返回值	成功返回预处理器指针，失败返回NULL
说明	加入是16k的语音数据，帧长20ms等于320个采样