Speex编解码器

最新推荐文章于 2024-05-23 09:52:38 发布

weixin_34294649

最新推荐文章于 2024-05-23 09:52:38 发布

阅读量213

点赞数

文章标签：嵌入式

原文链接：https://my.oschina.net/amoyai/blog/95445

版权

为什么80%的码农都做不了架构师？>>>

Speex是一套主要针对语音的开源免费，无专利保护的音频压缩格式。Speex工程着力于通过提供一个可以替代高性能语音编解码来降低语音应用输入门槛。另外，相对于其它编解码器，Speex也很适合网络应用，在网络应用上有着自己独特的优势。同时，Speex还是GNU工程的一部分，在改版的BSD协议中得到了很好的支持。

Speex一个编码的函数，这种方法是基于帧的，并不是一个文件一个文件处理，而是定一个帧的长度基于帧的编码为你想要的一个Speex格式，最后 Speex添加Speex文件的头信息，然后通过Socket发送Speex文件数据到服务器，服务器传到另外一台设备，设备接受为Speex文件并解码为PCM音频数据。这个Speex还有很多很多的功能，包括录制之前的设置和降噪都可以设置。通过解码将PCM数据恢复为WAVE文件格式，可以播放这个文件。

5.1 Speex语音编解码器编码

使用Speex进行语音编码，首先要：

#include < speex/speex.h >

在代码中，需要声明Speex比特包结构体，同时设置Speex编码器状态：

SpeexBits bits;

void * enc_state;

初始化两变量：

speex_bits_init( &bits );

enc_state = speex_encoder_init( &speex_nb_mode );

用speex_wb_mode代替为speex_nb_mode，即可转换为宽带编码。很多时候，你在使用采样率的需要知道帧的大小，可以通过变量frame_size（用样本中的单位表示，不以字节为单位）获得，调用下面函数：

speex_encoder_ctl( enc_state, SPEEX_GET_FRAME_SIZE, &frame_size );

实践表明，在采用8、16或32kHz采样率的时候，frame_size大约对应于20ms。Speex编码器还有很多参数可以设置，其中最有用的一个是质量参数，控制着比特率（bit-rate）交换的质量，通过下面函数设置：
speex_encoder_ctl( enc_state, SPEEX_SET_QUALITY, &quality );

quality是一个0～10（包含10）范围内的整数，窄带（narrowband）的质量和比特率（bit-rate）的对应关系如图9.2所示。

初始化成功后，对于每帧的输入：

speex_bits_reset( &bits );

speex_encode_int( enc_state, input_frame, &bits );

nbBytes = speex_bits_write( &bits, byte_ptr, MAX_NB_BYTES );

其中，input_frame是指向每个Speex帧开始的short型指针，byte_ptr是将写入已被编码的帧的char型指针，MAX_NB_BYTES是byte_ptr在不导致溢出时可被写入的最大字节数，nbBytes是byte_ptr实际被写入的字节数(编码大小以字节为单位)。在调用speex_bits_write之前，可能会通过speex_bits_nbytes(&bits)返回的字节数获得需要被写入的字节数，也可能使用speex_encode() 函数，它接受一个携带音频数据的float*型参数。不过这将使缺少浮点运算单元（FPU）的平台（如ARM）变的更为复杂。实际上，speex_encode和speex_encode_int()用同样的方法处理，编码器是否使用定点数取决于编译期的标志位，不由API来控制。

完成编码后，释放所有资源：
speex_bits_destroy( &bits );

speex_encoder_destroy( enc_state );

这是关于编码的部分。

5.2 Speex语音编解码器解码
使用Speex解码语音，首先要包含speex.h头文件。

#include < speex/speex.h>

需要声明Speex比特包的结构体和Speex解码器的状态

SpeexBits bits;

void* dec_state;

进行初始化
speex_bits_init( &bits );

dec_state = speex_decoder_init( &speex_nb_mode );

用speex_wb_mode代替speex_nb_mode，可转换为宽带（windband）解码。可能过变量frame_size来获得解码的帧大小

speex_decoder_ctl( dec_state, SPEEX_GET_FRAME_SIZE, &frame_size );

还可以能过下面函数设置是否使用“知觉增强”功能

speex_decoder_ctl( dec_state, SPEEX_SET_ENH, &enh );

如果enh是0则表是不启用，1则表示启用。在1.2-beta1中，默认是开启的。

做完初始化工作后，则可对每个输入帧进行如下操作：

speex_bits_read_from( &bits, input_bytes, nbBytes );

speex_decode_int( dec_state, &bits, output_frame );

其中,input_bytes是char型指针，包含了一帧的比特流数据，nbBytes是那帧比特流数据的大小（以字节为单位），output_frame是short型指针，指向一块内存区域，存储对语音帧的解码。第二个参数为空值（NULL）意味着没有获得到正确的比特(bit)数据，出现丢帧，Speex解码器会尽可能猜测最为准确的语音信号。

和编码器类似，可以用speex_decode()函数的一个float*型参数获得音频输出。

完成解码后，释放掉所有资源：

speex_bits_destory( &bits );

speex_decoder_destory( dec_state );

转载于:https://my.oschina.net/amoyai/blog/95445