Speex音频编解码

#include "stdafx.h"  
#include <speex/speex.h>  
#include <stdio.h>   
#include <ostream>  
 
#include <speex/speex_preprocess.h>  
#include <speex/speex_echo.h>   
#pragma comment(lib,"libspeexdsp.lib")   
#define FRAME_SIZE 160  
int main(int argc, char **argv) 

     
    char *inFile; 
     
    FILE *fin,*fout1,*fout2,*fout3; 
     
    short in[FRAME_SIZE]; 
    short out[FRAME_SIZE];   
    float input[FRAME_SIZE]; 
    float output[FRAME_SIZE];    
    char cbits[200]; 
     
    int nbBytes; 
     
    /*保存编码的状态*/ 
     
    void *stateEncode; 
    void *stateDecode; 
     
    /*保存字节因此他们可以被speex常规读写*/ 
     
     
     
    SpeexBits bitsEncode; 
    SpeexBits bitsDecode;    
    int i, tmp; 
     
    //新建一个新的编码状态在窄宽(narrowband)模式下  
     
    stateEncode = speex_encoder_init(&speex_nb_mode); 
    stateDecode = speex_decoder_init(&speex_nb_mode); 
    //设置质量为8(15kbps)  
     
    tmp=0; 
    speex_encoder_ctl(stateEncode, SPEEX_SET_VBR, &tmp); 
    float q=4; 
    speex_encoder_ctl(stateEncode, SPEEX_SET_VBR_QUALITY, &q); 
    speex_encoder_ctl(stateEncode, SPEEX_SET_QUALITY, &tmp); 
     
    inFile = argv[1]; 
     
    fin = fopen("c:/demo.pcm", "rb"); 
    fout1 = fopen("c:/demo_speex.raw", "wb"); 
    fout2 = fopen("c:/demo1.pcm", "wb"); 
    fout3 = fopen("c:/demo_slience.pcm", "wb"); 
    //初始化结构使他们保存数据  
 
    speex_bits_init(&bitsEncode); 
    speex_bits_init(&bitsDecode); 
    int ret; 
    int j=0; 
    SpeexPreprocessState * m_st; 
    SpeexEchoState *echo_state;  
    m_st=speex_preprocess_state_init(160, 8000); 
//  echo_state = speex_echo_state_init(160, 8000);   
    int denoise = 1; 
    int noiseSuppress = -25; 
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_DENOISE, &denoise); //降噪  
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_NOISE_SUPPRESS, &noiseSuppress); //设置噪声的dB  
 
     
    int agc = 1; 
    q=24000; 
    //actually default is 8000(0,32768),here make it louder for voice is not loudy enough by default. 8000  
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_AGC, &agc);//增益  
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_AGC_LEVEL,&q); 
    int vad = 1; 
    int vadProbStart = 80; 
    int vadProbContinue = 65; 
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_VAD, &vad); //静音检测  
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_PROB_START , &vadProbStart); //Set probability required for the VAD to go from silence to voice   
    speex_preprocess_ctl(m_st, SPEEX_PREPROCESS_SET_PROB_CONTINUE, &vadProbContinue); //Set probability required for the VAD to stay in the voice state (integer percent)   
     
 
    while (1) 
    { 
        memset(out,0,FRAME_SIZE*sizeof(short)); 
        //读入一帧16bits的声音  
        j++; 
        int r=fread(in, sizeof(short), FRAME_SIZE, fin); 
         
        if (r<FRAME_SIZE) 
            break; 
         
        //把16bits的值转化为float,以便speex库可以在上面工作  
    spx_int16_t * ptr=(spx_int16_t *)in; 
     
    if (speex_preprocess_run(m_st, ptr))//预处理 打开了静音检测和降噪  
    { 
        printf("speech,"); 
        fwrite(in, sizeof(short), FRAME_SIZE, fout3); 
    } 
    else 
    { 
        printf("slience,"); 
        fwrite(out, sizeof(short), FRAME_SIZE, fout3); 
    } 
        for (i=0;i<FRAME_SIZE;i++) 
             
            input[i]=in[i]; 
         
        //清空这个结构体里所有的字节,以便我们可以编码一个新的帧  
         
        speex_bits_reset(&bitsEncode); 
         
        //对帧进行编码  
         
        ret=speex_encode(stateEncode, input, &bitsEncode); 
        //把bits拷贝到一个利用写出的char型数组  
        nbBytes = speex_bits_write(&bitsEncode, cbits, 200); 
        fwrite(cbits, sizeof(char), nbBytes, fout1); 
        printf("%02d,",nbBytes); 
         
 
        //清空这个结构体里所有的字节,以便我们可以编码一个新的帧  
        speex_bits_reset(&bitsDecode); 
        //将编码数据如读入bits  
        speex_bits_read_from(&bitsDecode, cbits, nbBytes);   
        //对帧进行解码  
        ret = speex_decode(stateDecode, &bitsDecode,output); 
        for (i=0;i<FRAME_SIZE;i++) 
            out[i]=output[i]; 
        fwrite(out, sizeof(short), FRAME_SIZE, fout2); 
    } 
     
    //释放编码器状态量  
     
    speex_encoder_destroy(stateEncode); 
     
    //释放bit_packing结构  
     
    speex_bits_destroy(&bitsEncode); 
    speex_decoder_destroy(stateDecode); 
     
    //释放bit_packing结构  
     
    speex_bits_destroy(&bitsDecode); 
    fclose(fin); 
    fclose(fout1); 
    fclose(fout2); 
    fclose(fout3); 
 return 0; 
     
}  
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: speex 音频重采样是一种声音处理技术,它可以将一个音频流改变其采样率、比特率和声道数,以适应不同的应用和设备需求。 重采样是指在不改变原始音频数据的基础上,通过重新采样和插值来改变音频流的采样率和比特率。speex 音频重采样利用了一些高级算法来实现这一目标,如三角滤波法、FIR 滤波和 IIR 滤波等。 在实际应用中,speex 音频重采样可以用于语音编解码、语音信号处理、流媒体传输、网络音频会议等领域,以实现更高质量的音频体验。例如在网络音频会议中,由于网络延迟和带宽大小的限制,往往需要对音频流进行重采样以减少数据传输量和提高实时性。 总之,speex 音频重采样是一项重要的音频处理技术,它可以改变声音的采样率、比特率和声道数,以适应各种应用和设备需求,提高音频体验。 ### 回答2: Speex音频重采样是指通过改变音频采样率来改变音频文件的声音质量和大小。这种技术可以很好地优化音频文件的大小和质量,以便与特定播放设备、网络带宽或存储资源的场景相适应。 在Speex音频重采样中,采样率是指每秒钟从音频流中采集的声音样本数量。采样率通常以赫兹(Hz)为单位。在音频重采样中,可以将采样率从一个频率转换为另一个频率。例如,将一个44.1kHz采样率的音频文件转化为一个32kHz采样率的音频文件。 为了实现Speex音频重采样,需要使用专业的音频处理软件。重采样技术可以显著影响音频文件的声音质量。如果新的采样率比原来的采样率低,则可能会出现失真、噪音或其他质量问题。因此,需要根据具体要求和实际场景,选择适当的采样率,以实现尽可能好的音频质量和尺寸。 总之,Speex音频重采样是一种强大的音频处理技术,可以很好地优化音频文件的大小、质量和兼容性。通过选择适当的采样率和使用专业的音频处理软件,可以帮助用户实现更好的音频体验和表现效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值