Speech Signal Processing
文章平均质量分 68
Audio_Wang
这个作者很懒,什么都没留下…
展开
-
浅谈语音信号处理系列之一 概述
我一直对语音信号处理技术比较感兴趣,但同时也一直困惑它今后的发展应用,写这个系列的目的,是通过梳理和总结语音信号处理技术的主要分支,与大家共同讨论语音信号处理的发展方向和新的应用。在这里,主要是根据个人的一些工程实践和研究,简要的介绍语音信号处理几个主要方面的概念、原理实现和技术发展,应用等,非常希望大家共同交流讨论。 语言是人们最重要的交流工具,语原创 2009-10-21 16:08:00 · 7603 阅读 · 0 评论 -
Skype SILK codec overview
最近简单看了一下Skype SILK codec 算法, 基本原理和流程大体明白了, 以后有时间再仔细研究一下细节,今天就简单说说. SILK Codec是一个语音和音频编解码算法, 对于音频带宽、网络带宽和算法复杂度都具有很好的弹性。支持4种采样率:8KHz、12KHz、16KHz、24KHz;三种复杂度:低、中、高。编码码率在 6~40kbps(不同采样率具有不同的码率范围)以及还原创 2010-04-27 22:44:00 · 13499 阅读 · 7 评论 -
Speex Codec VS recent CELP Codecs
经过多年的验证,码激励线性预测模型(CELP,Code Excited Linear Prediction)是当下重建语音质量最好应用最流行的语音编解码模型之一。Speex编解码同其他CELP编解码器都是基于CELP模型的,那么CELP模型的主要思想是什么呢?1、利用线性预测(LP,Linear Prediction)模型去对声道系统建模;2、利用语音产生原理,通过一个自原创 2010-01-14 10:57:00 · 2862 阅读 · 0 评论 -
Speex 一种开源免费的语音编解码算法概述
本来希望各位CSDNer给出一些想法和建议,现在看来,对此刚兴趣的朋友大概都提前回家过年去了,那我就独自开始学习了。 一、Speex是什么? Speex工程是由Jean-Marc Valin 在2002年启动的一个项目,这个项目满足了当时缺少开源的、自由版权的语音编解码器的需求。因为当时大概只有G.711 等极少的语音编解码器可以自由使用,这种情形大大限制了VOIP在Lin原创 2010-01-08 15:26:00 · 5597 阅读 · 2 评论 -
深入剖析iLBC的丢包补偿技术(PLC)
丢包补偿技术(Packet Loss Concealment——PLC)是iLBC Codec中非常重要的一项技术,更是VOIP Codec应用中不可缺少的组成部分。iLBC的PLC只是在解码端进行封包补偿处理。在解码端根据收到的bitstream逐帧进行解码的过程中,iLBC decoder首先拿到每帧的 bitstream 要判断当前帧是否完整,如果没有问题则按照正常的iLBC 解码流原创 2010-01-05 16:24:00 · 7654 阅读 · 1 评论 -
对Speex Codec感兴趣的请进
Speex 是一款免费的开源语音编解码算法,主要应用在VOIP领域,最近准备学习一下。不知道有没有感兴趣的朋友,说一下你们的学习建议或者你们想了解Speex的哪些方面,我发现网上的资料并不多,也不知道市场上的情况如何,知道的人请不吝赐教,谢谢!原创 2010-01-07 16:08:00 · 2590 阅读 · 3 评论 -
你了解哪些语音频的标准化组织和相关的国际会议?
希望可以动态了解最新的语音频前沿技术,也希望对于那些发paper的研究人员有用。 1、第三代合作伙伴计划(3rd Generation Partnership Project,3GPP) 是一个成立于1998年12月的标准化机构。目前其成员包括欧洲的ETSI、日本的ARIB和TTC、中国的CCSA、韩国的TTA和北美的ATIS。3GPP的目标是在ITU的IMT-2000计划范围原创 2010-01-07 13:42:00 · 2100 阅读 · 0 评论 -
深入剖析iLBC 解码器原理
继续学习iLBC Codec ... 一、iLBC解码器的流程 如图1是没有丢帧情况下的iLBC解码流程,当解码端收到Payload时,首先从bitstream里面解析出解码所需要的参数。这里的解码参数从LPC开始,然后是重建起始状态,接下来的sub frame重建与编码时的顺序一致,通过解码三级形状/增益矢量并且相乘再叠加在一起就得到了重建的残差信号。然后进入语音增强模块,原创 2010-01-05 09:26:00 · 4858 阅读 · 0 评论 -
深入剖析iLBC的语音增强(Enhancer)
继续学习iLBC codec... 一、iLBC Enhancer 概述 iLBC decoder 中包含了语音增强单元,位置在重建残差信号与合成滤波之间,具体可见《深入剖析iLBC 解码器原理 》。这个增强单元作用于残差信号,通过减少隐藏在周期性较强的话音段中的相关噪声来提高语音的感知质量。相比传统的后滤波增强算法,这个算法限制了大幅度的修改残差信号,因此避免了过度增强所引原创 2010-01-06 15:07:00 · 3236 阅读 · 4 评论 -
深入剖析 iLBC 编码器原理
早在2005年就听说iLBC编解码算法,主要是应用在VOIP 的speech codec,但是一直没有深入研究算法原理,碰巧近期有一些时间可以学习一下它相比基于CELP模型的speech codec的优势。这套代码是浮点的,听朋友说要是转成定点代码会比较有用,只是可能需要的时间会多一点。如果想了解iLBC的一般介绍,如编码速率、应用等,可以参考前面的文章《iLBC编解码相关知识》 ,下原创 2009-12-31 17:37:00 · 4739 阅读 · 2 评论 -
常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.726,G.728,G.729,G.729.1)
总结了常用的ITU Speech Codec,谨供大家学习参考:1、G.711: Pulse code modulation (PCM) of voice frequencies 编码类型:压扩PCM编码速率:64Kbps理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);音质:长途质量;优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对原创 2009-12-24 16:44:00 · 7409 阅读 · 0 评论 -
iLBC编解码相关知识
自 VoIP 技术面世以来,业界对现存的低比特率编解码器 (codec) 标准的关注一直不断。影响 VoIP 设备制造和应用开发商的主要问题包括涉及众多专利持有者的复杂知识产权 (IPR) 管理、昂贵的使用许可模式,以及实际 IP 网络的低劣质量。在 2000 年,Global IP Sound (GIPS) 公司决定开发一种能够满足 VoIP 产业需求的 codec,目标是利用 GIPS转载 2009-12-25 09:12:00 · 2662 阅读 · 2 评论 -
浅谈语音信号处理系列之五 语音识别与说话人识别
语音识别和说话人识别-短暂的邂逅本文主要总结了学习语音识别的一段经历...一 初识 上研究生的时候,那时主攻的方向是低码率语音编码技术,但是已经听说语音识别是一个非常了不起的技术,可以想象,如果可以和机器进行无障碍的对话将是一个多么令人兴奋的事情。当时只是埋下了种子,简单的了解了一些名词解释和对Rabiner、李开复与CMU(卡内基梅隆)的钦佩。 二 学习 工作了一段时间,公司对原创 2009-10-26 16:04:00 · 5546 阅读 · 1 评论 -
浅谈语音信号处理系列之四 语音合成
语音合成一 语音合成基本原理 语音合成是一个“分析-存储-合成”的过程。一般要选择合适的基元(语音合成系统所处理的最小的语音学基本单元),将基元用一定的参数编码方式或波形方式进行存储,形成一个语音库。在合成时,根据待合成的语音信息,从语音库中取出相应的基元进行拼接,并将其还原成语音信号。 二 语音合成的主要分类 根据基元的选择方式以及其存储形式的不同,可以将合成方式笼统地分成波形合成方原创 2009-10-26 10:59:00 · 3158 阅读 · 1 评论 -
浅谈语音信号处理系列之二 语音信号处理的基础
下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献。一 语音信号的产生一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来看,气流通过声门(声带)形成激励源,从声门到口原创 2009-10-23 16:03:00 · 4189 阅读 · 0 评论 -
浅谈语音信号处理系列之三 语音编码
语音编码通过压缩语音信号,可以降低传输码率和节省存储空间。一 语音编码的应用1、语音信号的传输,重点是编解码实时性,传输码率,延时和信道相关因素。2、语音信号的存储,重点是语音质量和存储需求。二、现在有哪些主要的语音编码算法?1、语音质量 长途电话网质量:又叫网络质量,是高质量的语音; 通信广播质量:可以感到语音质量下降,但不妨碍正常通话; 合成语音质量:重建语音可以听懂内容,但是不够原创 2009-10-23 19:21:00 · 3817 阅读 · 0 评论 -
Skype SILK vs. iLBC vs. Speex
对比一下这三种VOIP语音算法的特点: 1 参数与特征 2 SILK性能 关于iLBC和Speex的性能可以参考以前写的文章。 3 关于VOIP一些观点(仅代表个人观点) 1) Skype 辛苦三年开发的SILK为什么要开源? 第一,技术上,其实SILK用到了很多Royalty Free的算法部分,遵原创 2010-04-28 22:58:00 · 18012 阅读 · 8 评论