语音处理
文章平均质量分 75
zsJum
c/c , VOIP, 视频音频流媒体, 视频会议
展开
-
音频压缩和编解码(Audio Compression and Codec)
音频压缩和编解码(Audio Compression and Codec)音 频压缩是一种形式的数据压缩,其被设计来减少音频文件的大小。音频压缩算法在计算机软件上实现叫做音频编码。音频编解码器是一个计算机程序,其根据一个给定音频文件格式或流音频格式压缩/解压缩数字音频数据。大部分编解码器被当作库实现,它的接口接到一个或更多多媒体播放器。针对音频压缩不同标准组织和公司有很多不同技术和标准可用转载 2008-03-19 11:29:00 · 6750 阅读 · 0 评论 -
Speex之四--编码器/解码器命令行
Speex的基本描述包括一个命令行编码器和解码器. 那些工具产生和读包装在OGG容器的Speex文件.虽然它是可以封装Speex在任意容器的,但Ogg被推荐为文件的容器的.本段描述如何为Ogg的Speex文件使用命令行工具4.1 speexencSpeexenc单元是通过裸PCM或wave文件被使用于创建Speex文件. 可使用下面命令:speexenc [操作] input_fi翻译 2012-05-21 09:35:44 · 4742 阅读 · 0 评论 -
Speex之三--编译和移植
3. 编译和移植通过自动配置在UNIX/Linux或其它平台支持(如Win32/cywin)编译Speex很容易,只需键入:%./configure[options]%make%make install其设置支持是通过Speex配置脚本的:-prefix= 指定Speex安装其本路径(如 /usr)-enable-shared/-disable-shared 是否编译翻译 2012-05-10 20:04:45 · 9987 阅读 · 1 评论 -
Speex之一-介紹Speex
Speex之一-介紹Speex介紹SpeexSpeex編解碼器(www.speex.org)存在是因為有這麼一個需求,即是開源同時專利版權也是免費的。這應該也是各開源軟體的必要條件。本質上講,Speex是針對語音的,vorbis是針對語音/音樂的。不像很多基它編碼,Speex不是為移動手機設計的,而是為網絡和VOIP應用設計的。文件壓縮當然也技持。Speex設計得很靈活,支持很寬範圍的語音翻译 2012-04-20 17:38:43 · 8260 阅读 · 3 评论 -
Speex之二-编码描述及相关概念解析
编码描述这一章节将描述Speex更为详细特征1. 概念在介绍全部Speex特征之前,这里有一些语音编码的概念以帮助更好地理解本手册。虽然有一些是语音/音频处理的概念,其它是特殊于Speex的(译得怪怪的) 采样率采样率使用赫茲(hz)表示,是每一秒钟信号采样的个数。以采样率Fs kHz为例,其最高频率等于Fs/2 kHz(Fs/2 被称为Nyquist频率)。这是信号处理的基本翻译 2012-04-24 17:01:09 · 6996 阅读 · 0 评论 -
SpeexCBR與Opus編碼對比測試
SpeexCBR與Opus編碼對比測試丟包率波形圖對比聽覺5%Speex與Opus都有個別字出現削波聽整段語音,都比較清晰。重點聽個別削波字,Speex失真程度比較Opus嚴重8%Speex與Opus削波增多,Speex削波會比Opus嚴重聽整段語音,Opus比較原创 2012-04-06 17:38:49 · 3892 阅读 · 7 评论 -
語音編解碼總結(二)
ITU語音編碼性能參數編碼算法集樣率比特率采樣位數時延CBRVBR立體聲多通道G.711PCM8 kHz64 kbit/s8 bit125µs 是否原创 2012-03-09 17:24:30 · 2169 阅读 · 1 评论 -
數字信號處理筆記 – 序列(上)
數字信號處理筆記 – 序列(上)序列是對模擬信號x(n)進行等間隔採樣,採樣間隔為T。比較如採樣頻率為16000Hz的採樣間隔為1/16000一、序列的運算(1)移位:序列x(n),当m>0时x(n-m):延时/右移m位x(n+m):超前/左移m位(2)翻褶x(-n)是以n=0的縱軸為對稱軸將序列x(n)加以翻褶(3)和同序列號n的序列值逐項對應相加原创 2012-03-08 22:10:11 · 2680 阅读 · 0 评论 -
Speex 编码宽带下 CBR与VBR对比测试
根據Speex官方網數據,在窄帶情況下,SpeexVBR性能優於SpeexCBR。於是,產品考慮將原來普通音質Speex CBR換成Speex VBR。但不知道在寬帶下性能如何。便對SpeexCBR與SpeexVBR進行對比測試。以下測試結果與大家分享一下,有不對的地方,請大家指正。Ps: SpeexCBR為使用默認參數下的CBR編碼SpeexVBR1為使用默認參數下的VBR編碼Spe原创 2012-02-21 21:32:47 · 2732 阅读 · 0 评论 -
自相关函数及c程序
自相关函数,是对信号自身的互相关,表示同一序列不同时刻的相关程度。是用寻找重复模式的数字工具,就如一个存在被覆盖噪声的周期信号,或识别丢失的基频。它经常被用于信号处理中的分析函数或序列,如时域信号。在不同的科学领域其定义各不相同,以下是离散语音数字信号自相关函数公式:其 c++程序实现可以写成如下:float AutoCorrelation(float* data, int原创 2010-12-21 17:43:00 · 10699 阅读 · 4 评论 -
語音編解碼總結(一)
語音編解碼的概述 隨著互聯網、移動通訊的發展,多媒體語音通信的應用越來越廣,降低信道傳輸速率、提高語音質量,成為人們不斷追求的目標。語音編碼技術在這過程中承擔著極其重要角色。 語音編解碼的分類語音編解碼技術有很多種,大致可以分為三類,即波形編碼,參數編碼,混合混碼。另外,根據編碼的速率來分類又可分為低速率、中速率、高速率編碼。根據應用不同也可分為音樂編碼和語音編碼。 1.原创 2012-02-28 15:44:47 · 2836 阅读 · 1 评论 -
預加重及C代碼
預加重及C代碼 預加重的作用預加重是提高信號高頻部分,使得低頻部分到高頻部分的頻譜平穩。使低頻到高頻的信噪比一樣。經常在頻譜分析中使用。 在語音頻譜分析中,我們為什麼要使用預加重?語音信號中由於人聲的激勵,使得頻譜低頻向高頻呈跌落狀態,也就是說高頻比低頻的成分少,高頻比低頻難求。所以在頻譜分析之前我們需要對時域語音信號進行預加重。 以下是預加重的C代碼pfDat原创 2011-04-19 10:51:00 · 1987 阅读 · 0 评论 -
G711 a律算法代碼解析
//a律 段落的分界線 (1111 1111)Fstatic short seg_aend[8] = {0x1F, 0x3F, 0x7F, 0xFF, 0x1FF, 0x3FF, 0x7FF, 0xFFF}; //查找段位置,分為8個段static short search(short val,short *table, short size){ short原创 2011-04-20 17:25:00 · 2813 阅读 · 0 评论 -
ADPCM压缩算法
ADPCM(Adaptive Differential Pulse Code Modulation),是一种针对 16bits( 或8bits或者更高) 声音波形数据的一种有损压缩算法,它将声音流中每次采样的 16bit 数据以 4bit 存储,所以压缩比 1:4. 而且压缩/解压缩算法非常简单,所以是一种低空间消耗,高质量高效率声音获得的好途径。保存声音的数据文件后缀名为 .AUD 的大多用AD转载 2011-08-31 14:17:45 · 1949 阅读 · 0 评论 -
离散卷积与C程序
卷积(convolution)是通过函数f和函数g产生第三个函数的一种数学算子。表示函数f与经过翻转和平移与g 重叠部分的累积。如果将参加卷积的一个函数看作区间的指示函数,卷积还可以被看作是“滑动平均”的推广。它的应用包括统计、计算机视角、图像与信号处理、电气工程和微方程式等。卷积能被定义不同于欧几里得空间的函数组。尤其是循环卷积能被用于周期函数,而且离散卷积函数能定义成整数计算。一般卷积应用原创 2010-12-22 15:40:00 · 2689 阅读 · 0 评论 -
自动增益(AGC)算法小结
Speex AGC算法模型过于简单,只是一个纯粹的算法,在有人声激励的情况 ,表现比较好。能快速增益到合适的音量,缺点是当一段时间没有被正确的信号激励之后,会出现过多地增益背噪声的问题,而且因为增益不稳定,变化速度比较快,会不断地出忽大忽小的背景噪声的情况。重写AGC算法主要就是解决上面提到的问题,除了算法本身以后,也考虑了实际中应用场景,总体的设计思路是前期增益变化会比较快,处于一个快速学习原创 2013-12-06 20:07:17 · 21280 阅读 · 3 评论