第一章概述
1.1 引言
人类进入信息社会的一个重要标志是计算机网络的迅速普及。在网络应用的初始阶段,人们通常只是通过网络发送电子邮件、进行文件传输或远程登录等。随着网络技术与多媒体技术的发展,计算机网络已逐渐演变成丰富多彩的多媒体信息网。越来越多的多媒体信息可通过网络进行传输与发布,一大批方便实用的多媒体应用(WWW浏览、音视频多媒体会议、远程教学、电子商务等)异军突起,成了网络应用的主力军。在众多多媒体应用中,实时多媒体会议是一个重要方面。它能广泛用于社会各行各业,特别是教育、行政、医疗、家庭娱乐等领域,极大地提高了人们的工作效率,方便人们的工作、学习和生活,具有广阔的市场前景和不可估量的社会效益及经济效益,因而也是当前研究和开发的热点。
当今信息社会的发展对通信提出了更高的要求,计算机技术的发展,特别是计算机网络技术的发展,人们已不满足简单的语音和文字通信,希望集语音、文字和图像于一体的多媒体通信。这是继电报、电话、传真及电子邮件(E-mail)又一新的通信手段。视频会议系统就是这种新型通信手段之一,它可以点对点通信,也可以多点对多点的通信,它在同一传输线路上承载了多种媒体信息:视频、音频和数据等,实现多点实时交互式通信,同时也可以将不同地点与会人员的活动情况、会议内容及各种文件以可视新闻的形式展现在各个分会场,这是一种快速高效、日益增长、广泛应用的新的通信业务。目前,各种高速的宽带网如FDDI(The Fibre Distributed Data Interface)、DQDB(The Distributed Queue Dual Bus)、B-ISDN均已得到较大的发展。同时,各个厂商的工作站的性能越来越好,已具备实时处理声音和动态图像的能力,技术上的进步为多媒体网络的发展提供了广阔的前景。多媒体信息可以在局域网上传输,将在办公系统等方面发挥重大作用。
1.2 视频会议的类型
视频会议系统作为目前最被看好的技术,对其进行科学的、系统的、全面的分类是相当重要的,将对其发展起到巨大的推动和指导作用。可以从视频会议系统通信网络、传输内容、终端配制以及媒体选择的不同等对其分类,下面将各种分类方法作一简要描述。
(1)从通信网络(或传输介质)角度
这是一种最直观、最简单也是最通用的分类方法。支持视频会议系统的通信网络有很多,而且各种通信网络均有其各自独特的特性,从而导致了在不同通信网络上视频会议系统统计和部署的差异性。包括现有的和未来的,通信网络实际上有很多种,但从其结构的本质来分,只有几种,即:通用电话网(POTS:PlainOld Telephone Service)、局域网(LAN:Local Area Network)、综合业务数字网(ISDN:Integrated Services Digital Network)、异步传输网(ATM:Asynchronous Transfer Mode)、因特网(Internet)。这样就形成了5种视频会议系统,即基于POTS、LAN、ISDN、ATM、Internet的视频会议系统。
(2)从传输内容角度
在实际的计算机会议系统中,根据不同程度的需求和目的,在网络中交互的会议内容也有极大的差别,这样形成了计算机会议系统的以下几种不同形式:
l 文件会议;
l 数据会议;
l 可视会议系统;
l 桌面视频会议系统
文件会议(Document Conferencing)的特点是与会者共享屏幕上的一个或多个窗口,通过这些窗口交换信息。这样的窗口称为共享白板,用户在这个白板上进行交互式的讨论或对文件进行修改等。文件会议系统可以传输图文,但不能传递语音。
数据会议(Data Conferencing)是在文件系统的基础上,在相同的通信线路上增加同时传送声音的功能,这样就成为数据会议。
可视会议系统是在数据会议系统的基础上,再增加静态图像或准动态图像传输的功能,于是便构成了可视会议系统。
桌面视频会议系统(Desktop Video Conferencing)可以支持语音、视频、文本、图形等多种媒体,因此也称为多媒体会议系统(Multimedia Conference System)。桌面视频会议系统是视频会议系统发展的方向。
从狭义角度讲,前两种会议系统并不属于视频会议系统。在此处这么处理的目的是使读者对视频会议结构有更全面的了解和体会。
(3)从终端配制角度
为了同时且实时地提供每个与会者的活动情况,从终端角度可将视频会议系统分为两种:
l 多窗口系统(Single Monitor Screen With Segmented Windows);
l 多监视器系统(Multiple Monitors)。
多窗口系统只需要一个监视器,每个会议场点(Conference Site)的活动情况只体现为一个窗口,这种系统的通信硬件成本和处理设备成本比较低,网络为每一次会议提供一个会议桥(Conference Bridge),该会议桥收集了从所有会议场点发送的音频和视频信息,并混合音频信号,合成视频信号,然后再将结果信号分发给每一个会议场点,由于有会议桥的存在,每个会议场点只需一个输入通道(Incoming Channel)便可接收到所有与会者的信息并在本地场点实时显示出来,不需进行复杂的视频和音频信号处理,从而降低了运行成本。
而多监视器系统则恰恰相反,不需要窗口技术,远端每一个会议场点的活动情况在本地场点都体现为一个单独的监视器,而且还需要若干输入通道来接收所有会议场点的活动信息,对视频、音频信号也要做较复杂的处理,不仅导致了通信硬件成本和处理成本的增加,而且还显著地增加了运行成本。
(4)从媒体选择角度
为了优化网络连接,从媒体选择角度,可将视频会议系统分为两类:
l 媒体可选系统(Selectable Media Conference);
l 媒体固定系统(Common Media Conference)。
对于媒体可选系统,每一个与会者(或会议场点)均有权选择(或授权选择和限制)在本地所需观察地特定场点地活动情况,这样,呈现在每个场点面前的会议活动情况是不尽相同的。在这种系统中,每个会议场点都需要一个特制的输入通道来接收外来的信息,而且会议桥必须有足够的处理能力(或潜力)为每个会议场点处理各不相同的视频音频信息数据(包括合成视频信号、混合音频信号等功能),从而导致了成本的上升,但却明显地增加了灵活性,有利于集中管理和授权控制,为各种存取保密、私有数据保密技术地实现提供了很强地硬件和软件设计基础。
而在媒体固定系统中,呈现在每个与会者面前的会议活动情况都是相同的,因此,会议桥只须将合成的视频信号和音频信号多目的(Multicasting)发送给所有会议场点,比媒体可选系统需要更少的带宽便可完成会议目的。虽然成本低,但灵活性很差,使各种保密技术的实现只能在高层协议中完成,且使这种实现复杂化,难于维护和设计。
(5)根据与会者参加的方式
根据与会者参加的方式,视频会议系统可分为以下四种:
l 单用户系统;
l 拨号群组系统;
l 点到点系统;
l 多点可视系统。
(6)根据通信节点的数量
多媒体视频会议系统将多个具有多媒体处理能力的节点通过各种通信机制互相连接起来,相互间可以进行多媒体的交互和数据交换。
根据通信节点的数量,视频会议系统可分为:
l 点对点视频会议系统;
l 多点视频会议系统。
点对点视频会议系统支持两个通信节点间视频会议通信功能,它的主要业务是:
①可视电话:可视电话是在现有公用电话网上使用的具有双工视频传送功能的电话设备。由于电话网带宽的限制,可视电话只能使用较小的屏幕和较低的视频帧率。例如使用3.3英寸的液晶屏幕,每秒钟可传送2~10帧画面。
②桌面视频会议系统:这种视频会议系统利用用户现有的台式机(如PC机)平台以及网络通信设备和远程另一台装备了同样或兼容设备的台式机通过网络进行通信,这种系统仅限于两个用户或两个小组用户使用。Intel公司的 Proshare Personal Conferencing Video System 200是这类系统的一个典型示例,这是一种点对点的个人视频会议系统,支持ISDN和LAN的连接,采用硬件编码压缩,软件解编码,为了方便协同工作,Proshare还提供共享笔记本和共享应用程序。
③会议室型视频会议系统:在会议室型视频会议系统的支持下,一群与会者集中在一间特殊装备的会议室中,这种会议室作为视频会议的一个收发中心,与远地的另外一套类似的会议室进行交互通信,完成两点间的视频会议功能。由于会议室与会者较多,因此对视听效果要求较高,一套典型的系统一般应包括:一台或两台大屏幕监视器、高质量摄像机、高分辨率的专用图形摄像机、复杂的音响设备、控制设备及其他可选设备,以满足不同用户的要求。
多点视频会议系统:多点视频会议系统允许三个或三个以上不同地点的参加者同时参与会议。多点视频会议系统的一个关键技术是多点控制问题,多点控制单元(MCU)在通信网络上控制各个点的视频、音频、通用数据和控制信号的流向,使与会者可以接收到相应的视频、音频等信息,维持会议正常进行。
此外,有时也将视频会议系统分为室内型会议系统和桌上型会议系统,或分为预先安排型(PreScheduled)和即时召开型(On-Demand)等。实际产品化的视频会议系统,是以上几种分类的综合体,如拨号群组系统必须设计为“预先安排型”系统,否则无法工作。
1.3 视频会议的发展及现状
和其他许多事物的发展一样,视频会议的发展也经历了一个从无序到有序、从不成熟到基本成熟的过程。在这个发展过程中,相继出现了电视会议、桌面视频会议、多媒体会议等多种远程会议系统。
电视会议又分为模拟系统和数字系统两种,模拟电视会议系统传送的是模拟音视频信号,因而需要铺设专用的模拟传输线路,不仅造价昂贵,而且模拟信号的多点切换与控制手段比较单一,不利于系统的扩容与级联;数字电视会议系统则是租用DDN信道,通过多点控制单元(MCU:Multipoint Control Unit)进行多点交换,控制相对比较灵活,而且便于实现主、分会场的多级连接。目前我国已经建成了以北京为主会场,下设9个分会场,覆盖全国29个省市的全国数字电视会议网络。这两种电视会议系统的缺点是费用昂贵,一般只有政府高级官员和重要部门能够使用,同时系统的功能比较单一,除了进行音视频多点传输和简单的会议控制外,很难增加新的功能。
桌面视频会议系统是面向广大机关企事业单位、组织和个人的较理想的远程会议工具,其优点是价格便宜、带宽利用率高、接入方式灵活(PSTN、ISDN、LAN、Internet、虚拟专网VPN等)、具有互操作性以及便于升级扩充等等,因而在最近几年里得到了飞速的发展。
多媒体会议是在桌面视频会议的基础上增加多媒体支持特性而形成的,目前对于多媒体会议还没有一个统一的定义和标准,也有人将桌面视频会议称作多媒体会议,因为许多桌面视频会议系统支持一些简单的多媒体特性(如电子白板、文字交流、文件传输、应用程序共享等)。多媒体会议系统虽然比普通视频会议系统有一定的进步,但仍然存在较大的局限性,只能召开一般意义上的互相交流信息和会议,而不能让某以群体用户合作完成一项共同的工作,或者说,多媒体会议系统的协同性不够。
在多媒体会议系统的发展过程中,音视频编码技术作为其中的关键技术之一起到了极大的推动作用。1990年CCITT第15研究组制定了针对活动图像的P×64 Kbps的编解器协议H.261建议之后,视频压缩编码技术开始走向标准化和实用化,一批符合H.261建议的专用芯片和多媒体会议产品(大多基于ISDN)相继问世。五年之后,该研究组又提出更低比特率的视频编解码方案H.263建议。该建议可将视频图像最少压缩到大约20Kbps,可在电话线上通过28.8Kbps的V.34 Modem传送音视频信号。音频编码建议则从早先的G.711、G.722建议发展到以后的G.723.1、G.728、G.729等。在音视频编码协议不断改进与发展的同时,多媒体会议本身的协议也实现了更新换代。从基于ISDN环境的H.320建议到基于分组交换网的H.323建议,再到PSTN的H.324建议,另外还有H.321建议(B-ISDN环境下的视频会议)、H.322建议(等时以太网环境下的视频会议)。表1-1列出了这些建议的基本概况。多媒体会议发展到现在,已经有许多成熟的系统,如NetMeeting、CUSeeMe、PictureTel、Proshare等等。
表1-1 几种不同的媒体会议国际标准
| H.320 | H.321 | H.322 | H.323 | H.324 |
适用网络 | N-ISDN | B-ISDN | 等时以太网 | 普通LAN | PSTN |
比 特 率 (bps) | <2M | <600M | <6/16M | <10/100M | <28.8K |
音频编码 协 议 | G.711, G.722, G.728 | G.711, G.722, G.728 | G.711, G.722, G.728 | G.711, G.722, G.728, G.723.1, G.729 | G.723.1 |
视频编码 协 议 | H.261 | H.261, H.262 | H.261 | H.261, H.263 | H.263 |
数据协议 | T.120 | T.120 | T.120 | T.120 | T.120 |
控制协议 | H.245 | H.242, H.245 | H.242 | H.245 | H.245 |
复用协议 | H.221 | H.222.0, H.222.1 | H.221 | H.225.0 | H.223 |
1.4 视频会议的发展方向
1.向高性能、多功能方向发展
目前由于网络的限制,商用视频会议系统的功能和性能还不能令人满意,但随着计算机网络的不断发展,具有QoS保证的高速多媒体通信网一定会得到普及。届时,开发具有高性能(如具有MPEG-2音视频质量、极低时延)的多媒体会议系统将不再是梦想。另外,多媒体会议的功能也会得到进一步地扩充,比如可以同时参加多个会议;并能在多个会议间快速切换,录制会议内容;另外还可以增加一些娱乐性的工具。
2.向协同性发展
目前的多媒体会议中,每个用户还是相对独立的个体。作为一个会议群体,相互之间的协同性比较差,这就抑制了多媒体会议的进一步发展。计算机支持的协同工作(CSCW)是近十多年来发展起来的多学科交叉的新研究领域,它研究如何利用计算机及计算机网络支持地理位置分散的人们协同工作,完成一项共同的任务。我们有理由相信,计算机网络的发展必然走向计算机协同工作,而多媒体会议也必然走向协同与高效。
3.向智能化发展
随着MPEG-4技术的成熟,下一代多媒体会议将首选基于内容的编码技术。这不仅将大大改善编码效率,而且能在会议系统中融入只能和用户交互性,用户进入会场时不再需要登记和输入口令,系统会根据用户的头像及声音自动进行身份认证及登记;用户可以随意选择或调节感兴趣的画面内容等等。
4.向集成化发展
多媒体会议产品最终将走入家庭,而体积小、价格低、操作简单的多媒体会议产品才会受到消费者的欢迎。现在市场上已经有符合H.320标准和H.324标准的可视电话出售,它将音视频I/O、压缩编码、显示、通信协议、互操作协议全部用硬件实现,使用时只要拿起电话拨一个电话号码就行,非常方便。
总之,今后的多媒体会议系统一定会变得更加方便、更加亲切、更加真实。