2004-10-20 |
1.音频传输中的巨大的开销: ~.IPv4头:至少20个bytes ~.RTP头:未压缩至少12个字节 对于每个Payload仅仅几十个bytes的音频packet,这是一个很大的开销(overheads). 改善的方法并不多,RTP头可以压缩,增大负载量, 但是负载量的增加引起了很多的问题,如把frame size增大到120ms,但此时a single packet loss or packet delay的增大将使声音的质量下降很大. 对SBC可以进行多路压缩到同一个包里,这是比较好的方案. 2.应用的环境不同,对应用的要求不同,对冗余音频数据(Redundant packet): 如交互式的媒体会议要求更少的延迟,因此当媒体包丢失时修复的快速性比修复的精确性更重要. 而流媒体传输就不同. 这样呢,交互式媒体会议的媒体包就可以包含前一个包的某种压缩形式,通过提供冗余(Redundancy)的传输来修复. 另外,由于Codecs技术的发展,冗余数据现在看来是一个很大的开销,在使用PCM_16_8_1时,每个frame是160 octets, 5个octets的冗余并不算大,但是对each frame 10个octets的G.729来说,5 octets则太大了. 因此现在redundant packet的应用很有限,主要是电信的音频会议, DTMF事件及其他事件(必须提供冗余确保 传输的可靠),还有使用奇偶前向纠错(parity FEC). 3.信道编码 ~.对无线网络,因为碰撞导致包损坏的情况比包丢失更常见,(因为congestion而丢包在Internet上更常见),而现在有些Codec可以容忍这种状况,因此在包损坏时把包完全扔掉是非常可惜的,因此引入部分校验和(Partial checksum). 使用标准的UDP/IPv4协议在UNIX和Winsock2上可以不使用UDP的checksum,而新的UDP Lite可以进行partial checksum, 这样可以只校验部分(比如IP/UDP/RTP header,或者IP/UDP/RTP header/部分媒体数据,例子如AMR: 3G的codec,可以只校验重要的class A). 4.VAD/CNG/DTX 的实现和技术标准 VAD (Voice Activity Detection) / DTX (Discontinuous Transmission) / CNG (Comfort Noise Generator) are used to reduce the transmission rate during inactive speech periods while maintaining an acceptable level of output quality. VAD classifies the input signal into active speech, inactive speech or background noise. Based on the VAD decisions, DTX inserts Silence Insertion Descriptor (SID) frames during the silence intervals. During silence, SID's are periodically sent to the CNG module, which generates ambient noise during periods of inactive speech on the receive side. Technical Specification Robust algorithm , works under a variety of background noise conditions. Uses an adaptive smoothing algorithm to avoid clipping of speech at active to inactive speech transition regions. Efficient Noise Generation Support for discontinuous transmission (DTX) of inactive frames (based on changes in inactive speech signal) Speech detection at low signal-to-noise ratios Adapts to changing background noise Reentrant, multi-channel implementation Configurable frame size 5.本身主要是从提高带宽利用率、业务优先级、低时延去抖动、丢包补偿和降低回声影响等5个方面,采用合适的编解码技术、静音检测(VAD)和舒适噪声(CNG)生成技术、RTP包头压缩技术、业务优先级、自适应调节JitterBuffer技术、丢包补偿技术、回声消除技术等来保证语音QoS质量。 6.关于时延问题: Studies have shown that it is difficult to conduct conversations when the total round-trip time exceeds about 300 milliseconds. [ITU-T Recommendation G.114. "One-way Transmission Time," May 2000.] |
VoIP的一些常识性问题
最新推荐文章于 2020-10-03 16:56:43 发布