延时是指话音从发起者到接收者所经过的时间[5],一般而言,端到端的延时由以下四部分组成:
(1)传播延时:指话音从一端到另一端通过网络的时间,由信号通过传播媒介的速度和传播的距离决定
(2)传送延时:指通过网络路径上的所有网络设备的时间
(3)包转化延时:指的是编码器进行数模转化的时间
(4)抖动缓冲延时:指的是在接收端用来保持一个或多个接收的数据包的时间,用来克服数据包到达时间的变化,也就是克服抖动产生的延时。抖动缓冲通常包括两级,第一级是解压缩,如果语音数据在传送端进行了压缩,则必须在此处解压缩;第二级则将解压缩数据传送至TDM流。
延时会引起语音会话过程的空白,带来语音的变形和会话的中断,也就是说,延时的增大导致了R值的减小。延时的时长在100~200ms之间开始被收听者所察觉,使得会话不自然。建议的延时上限为150ms,若延时达到200ms则开始有严重的会话中断。
抖动,也叫做延时的变化,是指在一个VoIP呼叫过程中所有发送的数据包到达的时间差异。当一个数据包发送时,发送端在RTP报文头上增加一个时间戳;当在另一端被接收时,接收端同样增加另一个时间戳;计算这两个时间戳可以得到这个数据包的通路时间。如果在一个呼叫中包含不同的通路时间,则存在抖动。在视频应用程序中,抖动表现为图像闪动,而在电话呼叫中,它表现的效果与丢包产生的效果相似,某些字词听不清楚或错误。抖动的大小取决于数据包的通路时间的差异程度,差异程度越大,则抖动也越大。如果抖动值大于50ms,则平均主观值MOS值剧烈地降低,认为是极差的语音质量。通过增加抖动缓冲的数量,可以有效地降低抖动的影响,但是增加了一毫秒的抖动缓冲,则相应增加了一毫秒的网络延时。