VoIP的一些常识性问题

 2004-10-20
1.音频传输中的巨大的开销:
~.IPv4头:至少20个bytes
~.RTP头:未压缩至少12个字节
对于每个Payload仅仅几十个bytes的音频packet,这是一个很大的开销(overheads).
改善的方法并不多,RTP头可以压缩,增大负载量,
但是负载量的增加引起了很多的问题,如把frame size增大到120ms,但此时a single packet loss or
packet delay的增大将使声音的质量下降很大.


对SBC可以进行多路压缩到同一个包里,这是比较好的方案.


2.应用的环境不同,对应用的要求不同,对冗余音频数据(Redundant packet):
如交互式的媒体会议要求更少的延迟,因此当媒体包丢失时修复的快速性比修复的精确性更重要.
而流媒体传输就不同.
这样呢,交互式媒体会议的媒体包就可以包含前一个包的某种压缩形式,通过提供冗余(Redundancy)的传输来修复.
另外,由于Codecs技术的发展,冗余数据现在看来是一个很大的开销,在使用PCM_16_8_1时,每个frame是160 octets,
5个octets的冗余并不算大,但是对each frame 10个octets的G.729来说,5 octets则太大了.
因此现在redundant packet的应用很有限,主要是电信的音频会议, DTMF事件及其他事件(必须提供冗余确保
传输的可靠),还有使用奇偶前向纠错(parity FEC).

3.信道编码
~.对无线网络,因为碰撞导致包损坏的情况比包丢失更常见,(因为congestion而丢包在Internet上更常见),而现在有些Codec可以容忍这种状况,因此在包损坏时把包完全扔掉是非常可惜的,因此引入部分校验和(Partial checksum). 使用标准的UDP/IPv4协议在UNIX和Winsock2上可以不使用UDP的checksum,而新的UDP Lite可以进行partial checksum, 这样可以只校验部分(比如IP/UDP/RTP header,或者IP/UDP/RTP header/部分媒体数据,例子如AMR:
3G的codec,可以只校验重要的class A).


4.VAD/CNG/DTX 的实现和技术标准
VAD (Voice Activity Detection) / DTX (Discontinuous Transmission) / CNG (Comfort Noise Generator) are used to reduce the transmission rate during inactive speech periods while maintaining an acceptable level of output quality. VAD classifies the input signal into active speech, inactive speech or background noise. Based on the VAD decisions, DTX inserts Silence Insertion Descriptor (SID) frames during the silence intervals. During silence, SID's are periodically sent to the CNG module, which generates ambient noise during periods of inactive speech on the receive side.

Technical Specification
Robust algorithm , works under a variety of background noise conditions.
Uses an adaptive smoothing algorithm to avoid clipping of speech at active to inactive speech transition regions.
Efficient Noise Generation
Support for discontinuous transmission (DTX) of inactive frames (based on changes in inactive speech signal)
Speech detection at low signal-to-noise ratios
Adapts to changing background noise
Reentrant, multi-channel implementation
Configurable frame size

5.本身主要是从提高带宽利用率、业务优先级、低时延去抖动、丢包补偿和降低回声影响等5个方面,采用合适的编解码技术、静音检测(VAD)和舒适噪声(CNG)生成技术、RTP包头压缩技术、业务优先级、自适应调节JitterBuffer技术、丢包补偿技术、回声消除技术等来保证语音QoS质量。


6.关于时延问题:
Studies have shown that it is difficult to conduct conversations when the total round-trip time exceeds about 300 milliseconds.
[ITU-T Recommendation G.114. "One-way Transmission Time," May 2000.]
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值