视频会议系统指通过现有的各种电气通信传输媒体,将人物的静、动态图像、语音、文字、图片等多种资料分送到各个用户的计算机上,使得在地理上分散的多个用户通过图形、声音等多种方式交流信息,是继电报、电话、传真及电子邮件之后又一新的通信手段。
早期的视频会议系统由于专用芯片等器件价格昂贵,而且当时的通信带宽无法满足其要求,所以推广受到极大限制。到20世纪80年代中期,编码和信息压缩技术的发展使得视频会议设备的实用性大大提高,20世纪90年代初期,第一套国际标准H.320获得通过,解决了不同厂商产品的兼容问题,配合H.261视频压缩集成电路技术的开发,视频会议系统朝着小型化发展,这些都为其普及打下了良好的基础。
(1)H.320标准。
1990年12月,ITU-T批准了在窄带ISDN上进行视听业务的标准H.320。H.320系列标准是会议系统中应用最早,最为成熟的协议,支持ISDN、E1、T1,带宽从64KB/s到2MB/s,几乎所有的会议系统厂家都支持,甚至许多LAN会议系统的产品也支持H.320。H.320可分为5个部分,即通用系统、音频、多点会议、加密、数据传送等。该标准涵盖了有关音频编码解码、视频编码解码、通信传输、系统控制等多个方面的标准,描述了整个系统以及与之相关的一系列建议,以该标准为基础的多点视频会议系统结构如图4-7所示。视频会议系统结构上主要由视频会议终端、多点控制设备、信道(网络)及控制管理软件组成。
图4-7 多点视频会议系统的结构
(2)视频会议系统的类型
视频会议系统在用户组成模式上分为点对点和多点视频会议系统两种,按技术实现方式上分为模拟(如利用闭路有线电视系统实现单向视频会议)和数字(通过软硬件计算机和通信技术实现)两种。
点对点视频会议系统支持两个通信节点间视频会议的通信功能,主要业务如下:
① 桌面会议系统。利用用户现有的台式机以及网络通信设备和异地另一台装备了同样或兼容设备的台式机通过网络进行通信。这种系统仅限于两个用户或两个小组用户使用。桌面会议系统较高档的通常在DDN与ISDN环境中运行,在112Kbps~768Kbps速率下,可提供每秒25~30帧CIF或QCIF图像;低档的通常在LAN/WAN环境中运行,在384Kbps速率下,提供每秒15~20帧图像质量。
② 可视电话。可视电话是在现有公用电话网上使用的具有全双工视频传送功能的电话设备。由于电话网带宽的限制,可视电话只能使用较小的屏幕和较低的视频帧率。如使用3.3英寸的液晶屏幕,每秒钟可传送2~10帧画面。使用Microsoft公司的NetMeeting,就可构成直接面向千家万户的简便的多媒体视频会议系统。该类系统运行在Internet和普通公共电话网(PSTN)上,在28.8Kbps或33.6Kbps等到速率下,一般可提供5~10帧QCIF格式的图像。
③ 会议室型视频会议系统。在会议室型视频会议系统的支持下,一群与会者集中在一间具有特殊装备的会议室中,这种会议室作为视频会议的一个收发中心,能与远程的另外一套类似的会议室进行交互通信,完成两点间的视频会议功能。由于会议室与会者较多,对视听效果要求较高,一套典型的系统一般应配有大屏幕显示设备、高质量摄像机、高级音响设备、控制设备及其他可选设备,以保证高质量的多媒体效果和不同用户的要求。
多点视频会议系统是允许三个或三个以上不同地点的参加者同时参与的会议系统。多点视频会议系统的一个关键技术是多点控制技术。多点控制单元在通信网络上控制各个点的视频、音频、通用数据和信号的流向,使与会者可以接收到相应的视频、音频等信息,以维持会议正常进行。
(3)视频会议系统的基本功能。
视频会议系统工作时,各个会议点的多媒体终端将反映各个会场的主要场景、人物及有关资料的图像、图片以及发言者的声音等同时进行数字化压缩,根据视频会议的控制模式,经过数字通信系统,沿指定方向进行传输,同时在各个会议点的多媒体计算机上,通过数字通信系统实时接收解压缩多媒体会议信息,并在其监视器上实时显示出指定会议参加方的会议场景、人物图像、图片和语音。
视频显示的转换控制有以下3种模式:
① 语音激活模式。会议的视频源根据与会者的发言情况(如声音的大小)来转换,可自动地将“主发言人”的视频图像传播到各个会议点。
② 主席控制模式。与会的任意一方均可能作为会议的主席,可以控制会议的视频源指定为某个与会方。
③ 讲课模式。所有分会场均可观看主会场的情况,而主会场则可以有选择地观看分会场的情况。
(4)视频会议系统的发展趋势。
1997年3月ITU-T发布了用于局域网上的视频会议标准协议——H.323,为那些与Internet和Intranet相连的视频会议系统提供了互通的标准。此前用于ISDN上的群视频会议标准协议——H.320一直主导着视频会议领域的技术和产品发展。
H.323是为在局域网、广域网上运行多媒体系统而设计的。它描述了将实时的语音、图像数据传输到PC机和视频电话中所需要提供的设备和服务。H.323提供多层次的多媒体通信,包括局域网上声音、视频以及数据通信,可以建立点播型、交互式多媒体会议,在共享数据的同时,用户可互相听到和看到对方。H.323是一个伞式标准,它参考了其他ITU-T标准,提供了系统和组件描述,呼叫模型描述以及呼叫信号处理。H.323 系列包括:视频标准H.261(P′64Kbps下音频视频业务的视频编码解码器)、H.263(低速率通信的视频编码解码器),音频标准G.711、G.722、G.728、G.723(5.3Kbps和6.3Kbps多媒体通信的双速率语音编码,将改名G.723.1)。
随着因特网的普及和网络带宽的扩展,基于H.323协议的视频会议系统会逐渐超过H.320的系统。由于网络条件、技术水平、生产工艺等因素的变化,视频会议系统已经从高价位专用市场向低价位普通用户市场转移。流媒体广播技术也越来越多的应用于视频会议系统中,这种技术的应用是对传统视频会议功能的扩展。
以前,多媒体文件需要从服务器上下载后才能播放,而一个内容为1分钟的视频文件,在56KB的窄带网络上至少需要用30分钟的时间来进行下载,因而在互联网上使用音频、视频信息进行交流并不方便。流媒体技术的产生和发展则给我们的生活和工作带来深远的影响,“流媒体”不同于传统的多媒体,它的主要特点就是运用可变带宽技术,以“流”(Stream)的形式进行数字媒体的传送,使人们在28KB到1200KB的带宽环境下都可以连续地在线欣赏到高品质的音频、视频节目。
(1)流媒体技术的实现原理。
1995年,RealNetwork公司推出了第一个流媒体产品,著名的Realplayer播放器。它采用流媒体技术,将连续的影像和声音信息经过压缩编码处理后放到网络服务器上,允许浏览者一边下载一边播放,而不需要等到整个多媒体文件下载完才能观看。流媒体技术先在客户端的计算机中创建一个数据缓冲区,在播放前先下载一段数据作为缓冲,当网络实际联线速度小于播放数据的速度时,播放器就播放缓冲区中的数据,避免播放的中断。流媒体技术是一种解决多媒体播放时网络带宽问题的“软技术”。缓冲区中的数据播放完后就被清除,再存入新的数据。
流媒体技术涉及到流媒体数据的采集、压缩、存储、传输以及网络通信等多项技术,需要完成流媒体的制作、发布、传输、播放4个环节。普通的多媒体文件数据量大,不支持流式传输,经过专用的流式压缩软件采用高效的压缩算法减小文件尺寸,再向文件中加入流式控制代码就将普通的多媒体文件制作成了流式多媒体文件。流式文件存储在流服务器中,通过控制软件进行数据流的分发,在Internet中,使用建立在UDP协议之上的RTP/RTSP协议(实时传输/实时流协议)传输流式数据包,同时使用缓冲技术来弥补数据的延迟,并重新对数据包进行排序,保证多媒体数据连续输出,不会因网络的阻塞导致播放出现停顿。浏览器端对接收的数据进行解码后再播放,在播放流媒体文件时不需要太大的磁盘空间,也不会保留文件的备份,有利于保护著作版权。
(2)流媒体技术的特点。
流媒体具有实时性,可以一边下载一边播放;流媒体技术有利于保护版权;流媒体服务器端的管理程序支持用户自主控制流媒体的播放,用户可以自由控制媒体的播放进度。
(3)流媒体技术的解决方案。
流媒体是由各种不同的软件控制实现的,这些软件在不同的层面上相互作用,主要是以下三种:编码器,将原始的多媒体数据转换成流格式数据;服务器,向用户发送流媒体;播放器,用户可以观看或收听流媒体。
① 编码器在尽可能保证文件原有声音图像质量的情况下,重新编码以降低文件的数据量,并按照容错格式将转换后的文件打包,以避免数据传输时发生丢失。转换后的文件成为流格式,可存放到流媒体服务器上,便于因特网上传播。
② 流媒体服务器响应客户端的请求,并保持同客户端播放器之间的双向通信;播放器上对音频视频的播放控制如暂停、播放、前进、后退、拖动等操作,服务器都要做相应的控制,以调整数据流。这种对传送数据的控制能力大大高于Web服务器的要求,Web服务器仅按客户端的URL地址将网页文件发送到浏览器上就结束与浏览器的通信。流媒体服务器可以同时处理多个任务,一边要处理多个新接收的实时广播数据,将其编码;一边还可以响应多个观众的播放器请求,同时还要处理服务器硬盘的备份数据流。流媒体服务器起到了分发控制数据流的作用。
③ 流媒体播放器能够播放和丢弃接收到的数据流,并提供对流的交互操作,如暂停、播放、快进等,有些播放器还提供一些额外的功能,如录制、调整音频视频,甚至系统文件记录等。
目前在流式技术领域竞争的公司主要有Microsoft、RealNetwoks、Apple三家,它们相应的产品是Windows Media、Real Media、QuickTime。其三种组件产品见表4-7。
表4-7 流媒体技术相关产品
公 司 |
编码器软件 |
服务器软件 |
播放器软件 |
RealNetwoks |
RealProducer Plus 8 |
RealServer Basic 7 |
RealPlayer Plus 8 |
Microsoft |
Mirosoft Windows Media Encoder 7 |
Mirosoft Windows Media Services 7 |
Mirosoft Windows Media Player 7 |
Apple |
QuickTime Pro |
QuickTime Streaming Server 2.01 |
QuickTime 4.1.2 |
(4)流媒体技术的应用和发展前景。
① 远程教育。
远程教育中最基本的要求是将多媒体信息从教师端传递到远程的学生端。受限于网络带宽,流媒体成为最佳的解决方案。目前能够在Internet网上进行多媒体交互教学的技术多为流媒体,像Real System、Flash Shockwave等技术经常应用到网络教学中。使用流媒体中的VOD(视频点播)技术,更可以达到因材施教、交互式教学的目的。
② 宽带视频点播。
随着宽带网的发展,流媒体技术越来越广泛地应用于视频点播系统,使用户可以在家中欣赏到与电视节目相当的流式视频节目。目前,很多大型的新闻娱乐媒体都在Internet网上提供基于流式技术的音频、视频节目,如中央电视台、国外的CNN、CBS等都提供了视听在线栏目。
③ 互联网直播。
从互联网上直接收看实时新闻、体育赛事、重大庆典、商贸展览已经成为越来越多的网民的选择,很多厂商也希望借助网上直播将自己的产品和活动在第一时间传遍全球,这些需求都促成了互联网直播的形成。
流媒体技术在互联网直播中起着重要的作用,保证了在低带宽的环境下提供高质量影音。RealNetwork公司的SureStream智能技术可以保证不同连接速率下的用户得到不同质量的影音效果,流媒体的多地址广播技术可以大大减少服务器端的负荷,同时最大限度地节省带宽。
④ 视频会议。
流媒体技术的出现为视频会议的发展起了很重要的作用。用流媒体格式传送影音,可以达到及时的效果而不必等待整个影音传送完毕。视频会议是流媒体的一个商业用途,如用于点对点通信的可视电话,只要用一台已经接入Internet网的计算机和一个摄像头,就可以与世界任何一个地方的人进行音视频通信。大型企业利用基于流技术的视频会议系统来组织跨地区的会议和讨论,节省了大量的开支和时间。
流媒体应用将向Web 3D应用及无线应用方向发展。在互联网上实现三维动画目前困难重重,首要问题还是巨大的数据量与网络带宽限制的矛盾。流媒体的应用为传送三维实体提供了新的途径,