所谓的 VoIP 是以 IP 分组交换网络为传输平台,对模拟的语音信号进行压缩、打包等一系列的特殊处理,使之可以采用无连接的 UDP 协议进行传输。
  通过因特网进行语音通信是一个非常复杂的系统工程,其应用面很广,因此涉及的技术也特别多,其中最根本的技术是 VoIP VoiceoverIP )技术,可以说,因特网语音通信是 VoIP 技术的一个最典型的、也是最有前景的应用领域。本文主要介绍 VOIP 的基本传输过程。
  传统的电话网是以电路交换方式传输语音,所要求的传输宽带为 64kbit/s. 而所谓的 VoIP 是以 IP 分组交换网络为传输平台,对模拟的语音信号进行压缩、打包等一系列的特殊处理,使之可以采用无连接的 UDP 协议进行传输。
  为了在一个 IP 网络上传输语音信号,要求几个元素和功能。最简单形式的网络由两个或多个具有 VoIP 功能的设备组成,这一设备通过一个 IP 网络连接。从中可以发现 VoIP 设备是如何把语音信号转换为 IP 数据流,并把这些数据流转发到 IP 目的地, IP 目的地又把它们转换回到语音信号。两者之音的网络必须支持 IP 传输,且可以是 IP 路由器和网络链路的任意组合。因此可以简单地将 VoIP 的传输过程分为下列几个阶段。
   1 、语音 - 数据转换
  语音信号是模拟波形,通过 IP 方式来传输语音,不管是实时应用业务还是非实时应用业务,道貌岸首先要对语音信号进行模拟数据转换,也就是对模拟语音信号进行 8 位或 6 位的量化,然后送入到缓冲存储区中,缓冲器的大小可以根据延迟和编码的要求选择。许多低比特率的编码器是采取以帧为单位进行编码。典型帧长为 10~30ms. 考虑传输过程中的代价,语间包通常由 60 120 240ms 的语音数据组成。数字化可以使用各种语音编码方案来实现,目前采用的语音编码标准主要有 ITU-TG.711. 源和目的地的语音编码器必须实现相同的算法,这样目的地的语音设备帮可以还原模拟语音信号。
   2 、原数据到 IP 转换
  一旦语音信号进行数字编码,下一步就是对语音包以特定的帧长进行压缩编码。大部份的编码器都有特定的帧长,若一个编码器使用 15ms 的帧,则把从第一来的 60ms 的包分成 4 帧,并按顺序进行编码。每个帧合 120 个语音样点(抽样率为 8kHz )。编码后,将 4 个压缩的帧合成一个压缩的语音包送入网络处理器。网络处理器为语音添加包头、时标和其它信息后通过网络传送到另一端点。语音网络简单地建立通信端点之间的物理连接(一条线路),并在端点之间传输编码的信号。 IP 网络不像电路交换网络,它不形成连接,它要求把数据放在可变长的数据报或分组中,然后给每个数据报附带寻址和控制信息,并通过网络发送,一站一站地转发到目的地。
   3 、传送
  在这个通道中,全部网络被看成一个从输入端接收语音包,然后在一定时间( t )内将其传送到网络输出端。 t 可以在某全范围内变化,反映了网络传输中的抖动。网络中的同间节点检查每个 IP 数据附带的寻址信息,并使用这个信息把该数据报转发到目的地路径上的下一站。网络链路可以是支持 IP 数据流的任何拓结构或访问方法。
   4 IP - 数据的转换
  目的地 VoIP 设备接收这个 IP 数据并开始处理。网络级提供一个可变长度的缓冲器,用来调节网络产生的抖动。该缓冲器可容纳许多语音包,用户可以选择缓冲器的大小。小的缓冲器产生延迟较小,但不能调节大的抖动。其次,×××将经编码的语音包解压缩后产生新的语音包,这个模块也可以按帧进行操作,完全和×××的长度相同。若帧长度为 15ms ,,是 60ms 的语音包被分成 4 帧,然后它们被解码还原成 60ms 的语音数据流送入解码缓冲器。在数据报的处理过程中,去掉寻址和控制信息,保留原始的原数据,然后把这个原数据提供给×××。
   5 、数字语音转换为模拟语音
  播放驱动器将缓冲器中的语音样点( 480 个)取出送入声卡,通过扬声器按预定的频率(例如 8kHz )播出。简而言之,语音信号在 IP 网络上的传送要经过从模拟信号到数字信号的转换、数字语音封装成 IP 分组、 IP 分组通过网络的传送、 IP 分组的解包和数字语音还原到模拟信号等过程。