第1章 绪论
1.1 数字影院的发展现状
信息媒体的数字化为信息的存取提供了极大的便利,同时也显著地提高了信息表达的效率和准确度。特别是随着计算机网络通讯技术的发展,数据的交换和传输变成了一个相对简单的过程。人们借助于计算机、数字扫描仪、打印机等电子设备可以方便、迅捷地将数字信息传达到世界各地。随之而来的副作用是通过网络传输数据文件或作品,使有恶意的个人或团体有可能在没有得到作品所有者的许可下,拷贝和传播有版权的内容。因此,如何在网络环境中实施有效的版权保护(Copyright Protection)和信息安全(Information Security)手段已成为一个迫在眉睫的现实问题。近几年发展起来的数字水印技术为版权保护和信息安全等问题提供了一个潜在的解决方案,因而引起了国际学术界、企业界以及政府有关部门的广泛关注。
同样,在电影行业,人们已经广泛认识到,数字化进程是必然趋势。数字影院将极大地降低整个影片行业的物资、人力成本,并且带来更多的数字化特有的效果。但是,安全问题一直是困扰数字影院的一大难题,成为当前国际上的工业界、学术界的研究焦点。例如,美国电影制片协会已经成立了专门的工作组Digital Cinema DC28[1]。
1.2 数字影院的数字版权问题
数字影院建设中主要有这样的几个挑战性问题:(一)、建立从数据中心到各个影院的可靠、快速的内容分发网络体系;(二)、高质量的音视频投影仪的开发;(三)、安全有效的数字版权管理体系。本文将主要考察数字影院的安全问题,提出结合数字水印技术的数字版权管理体系。
1.2.1 数字影院的数字版权管理的特点
到目前为止,针对不同内容的保护系统已经很多了。如卫星电视订阅,视频游戏的拷贝保护,基于网络的内容分布[2],但是,这些系统的操作环境和数字影院有本质上的区别。
首先,内容的价值曲线不同。数字影片在刚刚发行后的前期,价值最高,随后,就会急速下降。这对影片的前期发行提出了相当高的安全要求,而对后期相对较低。
第二,数字影院的参与者相对更具体,数量也少。投影仪包含了昂贵的光学设备和复杂的抗盗版技术装备。
盗版者的目的就是获取没有保护的作品的拷贝件,这样就可以通过各种渠道任意传播。例如通过刻录的光盘(VCD 、DVD),现在更多的是通过互联网,也是危害最大的渠道。现在最常见的攻击方式就是利用手持摄像机录制影片,然后通过互联网任意传播。
1.2.2 可能的引起泄密的途径
· 在内容的分发链中,出现内容泄漏,如技术上的攻击,有攻击者试图从合法的投影仪中提取出解密后的影片内容,攻击者试图提取出认证密钥,这样其它设备也可以替代专用投影仪。
· 攻击加密、解密算法。不过这样的可能性不大,因为公开的安全加密解密算法是经过实践检验的,另外即使破解了,需要的时间很长,对影片的价值影响也不大了。
· 通过共谋攻击袭击数字水印指纹系统。目前已有相关报道证实,一定数量的用户共同攻击,可以除去嵌入到影片中的水印指纹信息,得到不含有水印指纹的盗版作品。
· 其他人为因素:如内部人员的泄密。
· 通过手持摄像机录制的盗版作品,目前这是最普通的攻击方式。如果攻击者录制的质量高,而且放到互联网上后,将会带来巨大的损失。
1.3 本文内容:
第一章是绪论,简要介绍数字影院的提出及其关键问题,以及本文的组织结构和贡献。
第二章介绍数字影院版权管理系统的原理,主要构成和存在的问题,并详细描述微软研究院提出的版权管理系统和相关的核心技术解决手段。
第三章介绍在数字影院中应用的数字水印技术,研究基于正交模板的高容量数字指纹水印模型。从统计分析的角度,采用扩展谱的嵌入策略,研究高容量、鲁棒性和不可觉察的数字水印算法,从理论上分析在一定条件允许范围内,如何达到最大容量,最佳检测效果,和最高鲁棒性。给出了两种不同的图像水印算法,主要包括:一、基于空间域的高容量水印算法。二、基于多尺度小波编码的水印算法。在对标准小波变换进行修正后我们得到了非标准形式下的酉表示,从而可以将该算法纳入到一般性的水印框架中,并且该算法在水印检测中不需要原始图像。
第四章提出一种基于数字指纹水印的访问控制模型,阻止数字内容在网络上的非法传播,保护数字内容版权。基本原理是首先规定向数字媒体内容(图像、视频、音频等)中嵌入主动数字水印信息,然后在传播途中的网络节点处检测提取水印信息,再根据水印信息决策多媒体内容在网络中传输的合法性,从而控制数字内容在网络中的传播,并且提供版权保护的事实证据和线索。
第五章是结束语,包括本文的创新点,结论以及数字水印技术展望。
第2章 数字影院的版权管理问题
数字影院建设中的一个核心问题,就是安全问题,具体而言就是数字内容面临的共同的数字版权管理问题。本文主要考察了微软研究院Darko Kirovski等提出的数字影院版权管理系统[3]和相关核心技术手段。
2.1 微软提出的数字影院版权管理系统
这个系统由一套安全节点构成,这些节点实行数字版权保护的功能,由不同参与方协同操作。
2.1.1 节点功能
数字版权管理系统是由一些相互通信的安全节点构成的。节点是一个抽象的概念(具体而言可以是投影仪),是系统的实体,用来安全储存、传递需要保护的内容。具有权限的节点可以访问(如显示)给定的内容。具体而言,节点的功能为: I
· 认证(Authentication)
· 版权管理( Rights management (licensing) )
· 内容的加密和解密(Content encryption and decryption)
· 数字指纹水印的识别(Fingerprinting)
(1) 认证
根据在分布链中的位置,一个节点可以作为发送器或接收器。当作为发送器时,它必须能够保证接收器有权接收,反过来,当作为接收器时,必须向发送器证明是合法接收者。这就需要这些节点具备认证功能。我们利用公开密钥加密法,每个节点需要保存一个私钥,并且和公钥认证系统联系,实施基本的公开密钥操作(加密、解密、签名和校验)。.
(2) 版权管理和许可协议
数字版权管理的一个主要目的,就是当内容通过电子形式分布后,内容发行者可以控制内容的访问权。这需要定义专门的数字版权语言,内容发行者可以表达访问的规则和条件协议。在任何人访问内容前,数字版权节点必须校验对方是否遵守协议。
一个典型的许可协议指定了访问权利或行动,如播放或传播到下一个节点等。每一个行动和一套条件密切相关,这些条件构成了一套控制体系,只有符合具体条件,节点才能具备具体的行动能力。这些限制条件的实施需要安全的计数器或安全时钟。另外,许可协议可以指定针对内容的行动,如嵌入数字指纹水印等操作行动。其他相关的许可协议还有:
· 协议的有效期;
· 特定时间的放映限制;
· 执行审计日志,即自动记录每个投影仪放映的内容标题、时间、跨度等;
· 投影仪特征要求 (如审计特征,安全特征,数字水印指纹识别特征)。
协议需要采用密码学技术加以保护。如采用数字签名保证其完整性和机密性。XrML版权语言具有上述的所有功能。
(3) 内容的加密和解密
如上所述,节点是安全的储存室,并可以访问存储的内容。节点之间的渠道是不安全的,因此需要对采用加密解密的手段保护内容的机密性。对于多媒体内容加密,不能采用传统的针对文本的策略,要充分考虑到多媒体内容的量大问题,进行选择性加密,并且实际可行的策略必须结合有损压缩编码,如MPEG1/2/4等。这是目前的一个研究热点。
(4) 数字水印指纹识别
数字水印指纹就是嵌入在数字内容中的不可见信息,具有抵抗一般攻击的鲁棒性。可以被用来追踪盗版源泉,可以用来控制访问的认证。本文将考察数字水印技术的关键问题,提出基于数字水印技术的访问控制模型,将其有效结合在数字影院的版权管理系统中。
2.1.2 内容的分发链
一个典型的分布链包括影片制造商、发行商、影院三个主要参与者。在[3]提出的数字版权管理系统中,有两种可能的分布链。每一个参与者就是一个节点,拥有不同的权限和访问能力。节点之间通过规则进行相互通信。整个完整的系统就是一套版权管理系统。
Studio |
Tier 1 |
distrib. |
Tier 2 |
distrib. |
Cinema |
Film |
usage data, payment |
Studio |
Tier 1 |
distrib. |
Tier 2 |
distrib. |
Cinema |
Film |
access authorisation |
(license generation), |
usage data, payment |
Clearing |
house |
a) |
b) |
图2-1.两种可能的影片分发链.
2.2 数字图像信息加密
采用传统密码学理论开发出来的加解密系统,对于待加密文件的处理是将其加密成密文再进行传送,使得在网络传递过程中的非法栏截者无法从中获取机密信息,达到保密的目的。传统的加密系统如DES和IDEA等是基于叠代乘积密码实现的。在这些方法中,为保证安全性,一般主要依靠由密钥以非常复杂的方式控制的替换过程,对于数据量极为庞大的多媒体数据流而言,难以实现快速的加、解密算法。由于多媒体信息有其自身的特点,因此我们必须结合多媒体信息的特点,研究适合多媒体信息的加密技术。
对于模拟电视信号,常常采用置乱的方法进行加密。模拟置乱体制中有幅度置乱和时序、同步抑制和全图像倒置置乱、随机行倒置置乱、时序倒置置乱、行置换置乱、行平移置乱、行循环置乱、行分量切割置乱和象素置乱发等。
对于数字图像和数字视频数据,由于其巨大的数据量和自相关性,我们既可以在空间上(象素的位置空间和色彩空间)对其进行加密,也可在变换域空间对其进行加密。
针对MPEG视频流,Mayles[4]提出将经过MPEG压缩的数据位流视为普通数据位流,然后通过传统的DES算法进行加密/解密。其缺点是:运算量大,不能满足实时性的要求。Lei Tang[5]第一个提出把加密/解密过程集成到MPEG视频压缩/解压缩过程中。在该算法中,使用了一个随机扫描(random scanning)序列作为密钥来代替通常的之形扫描(zigzag scanning)序列对DCT变换系数进行重新排列,以达到加密的目的。算法的计算复杂度低,但其缺点是使MPEG的压缩效率大幅度下降。C. Shi[6,7]提出了一个快速MPEG视频加密算法,称之为VEA(Video Encryption Algorithm)。其基本思想是使用一个密钥控制随机改变DCT系数的符号位。在解密的过程中,通过IDCT的反变换,得到加密的效果。对于每一个非零的DCT系数,加密过程仅需在符号位和密钥控制的随机0-1序列的当前位之间完成一次XOR操作,实现速度相当快,且不影响MPEG的压缩效率。
对于数字图像而言,考虑到数字图像所特有的大数据量与自相关性,针对数字图像的加密不仅可以在空间域(色彩空间、位置空间)上展开,同时也可以在数字图像的变换域(如频域)上进行。在图像加密中数字图像置乱起着不可忽视的作用,它类似于对数字图像的空间域进行如经典密码学对一维信号的置换,或者修改数字图像的变换域参数,使得修改后的图像成为面目全非的杂乱图像,从而保护了数字图像所要表达的真实内容。
2.3 数字图像信息隐藏技术
数字图像信息隐藏主要研究基于数字图像的信息隐藏技术,它主要针对数字图像的二维空间(或基于数字视频的三维空间),将需要保密的信息隐藏于公开的图像中。它充分利用数字图像本身所具有的迷惑性,来达到伪装保密信息,从而逃避可能的检测者,以达到秘密信息的传递。
信息隐藏的例子层出不穷,从中国古代的藏头诗到中世纪欧洲的栅格系统,从古希腊的蜡板藏书到德国间谍的密写术等这些都是典型的例子。多媒体技术的广泛应用,为信息隐藏技术的发展提供了更加崭新的领域。1996年5月30日-6月1日,在英国剑桥大学牛顿研究所召开了第一届国际信息隐藏学术研讨会,标志着一门新兴的交叉学科——信息隐藏学的正式诞生[8]。信息隐藏学作为隐蔽通信和知识产权保护等的主要手段,正得到广泛的研究与应用。
信息隐藏技术主要由两部分组成:(1)信息嵌入算法。它利用密钥实现秘密信息的隐藏。(2)隐蔽信息提取/检测算法(检测器)。它利用密钥从隐蔽载体中检测/恢复秘密信息。在密钥未知的前提下,第三者很难从隐秘载体中得到或删除、甚至发现秘密信息。
信息隐藏技术具有以下最基本的特性:
透明性:经过一系列隐藏处理,宿主信息必须没有明显的降质现象,而被隐藏的信息无法人为地看见或听见,即人的生理感官辨别和计算机检测都无法发现宿主信息内包含了其它信息。
鲁棒性:要尽量保证隐藏了信息之后的宿主信息在经历可能的处理和攻击后,而不导致被隐藏的信息丢失的能力。
效率性:嵌入编码和提取解码的时空开销代价是否是可以接受的。
安全性:对隐藏信息、嵌入算法进行适当的加密,增强隐藏信息的安全性。
Adelson[9,10]把人类视觉系统对对比度的敏感程度与数字图像的空间频域相对应,利用空间频域的高频带隐藏信息。Bender[11]改进了Adelson的方法,采用混沌序列对保密信息进行加密,然后再实现信息的隐藏。但是,这类算法的缺陷是,他们不能忍受通用信号处理操作对载体信号引入的失真,如噪声叠加,有损压缩等。
信息隐藏学是一门新兴的交叉学科,在计算机、通讯、保密学等领域有着广阔的应用背景,信息隐藏技术也正得到广大的科技工作者的研究。数字水印技术,作为数字媒体版权保护的有效性,也作为信息隐藏学的一个重要研究分支,已得到广泛的研究和一定的应用。
2.4 数字水印技术
多媒体数据的数字化为多媒体信息的存取提供了极大的便利,同时也极大地提高了信息表达的效率和准确性。随着网络的日益普及,多媒体信息的交流达到了前所未有的深度和广度,其发布形式愈加丰富。人们可以通过Internet网发布自己的作品,传递重要信息,进行网络贸易等。但是其暴露出的问题也十分明显:作品侵权更加容易,篡改更加方便。如何既充分利用Internet网的便利,又能有效地保护知识产权,已受到人们的高度重视。
数字水印(digital watermarking)是实现版权保护的有效办法,已成为多媒体信息安全研究领域的一个热点,也是信息隐藏技术研究领域的重要分支。它通过在原始数据中嵌入秘密信息——水印(watermark)来证实该数据的所有权。被嵌入的水印可以是一段文字、标识、序列号等。水印通常是不可见或不可察,它与原始数据(如图像、音频、视频数据等)紧密结合并隐藏其中,成为源数据不可分离的一部分,并可以经历一些不破坏源数据使用价值或商用价值的操作而存活下来。
数字水印技术除具备信息隐藏技术的一般特点外,还有着其固有的特点和研究方法。例如,从信息安全的保密角度而言,隐藏的信息如果被破坏掉,系统可以视为安全的,因为秘密信息并未泄露;但是,在数字水印系统中,隐藏信息的丢失意味着版权信息的丢失,从而失去了版权保护的功能,这一系统就是失败的。因此数字水印技术必须具有较强的鲁棒性、安全性和透明性。
90年代以来,对数字水印的研究兴趣在不断的增长。1998年的国际图像处理大会上,还开辟了两个关于数字水印的专题讨论;国际光学工程学会(SPIE)从1999年起,每年召开一次多媒体信息安全与数字水印大会,其会议的论文主要是关于数字水印技术方面的文章。目前,国际上剑桥大学、IBM研究中心、NEC美国研究所、麻省理工学院等都进行了广泛深入的研究;国内清华大学、北京大学、北京邮电大学、中科院自动化所、北方工业大学、浙江大学、国防科技大学等都在对该技术进行深入的研究。
数字水印技术按表现形式为可见水印(perceptible)和不可见水印(imperceptible),前者如电视屏幕左上角的电视台的台标,后者,嵌入的水印是无法用肉眼看见,我们所指的数字水印技术,若无特别指明,均指不可见水印技术。按抗攻击能力可分为鲁棒水印(robustness)和易损水印(fragile),前者主要用于版权保护和使用跟踪,后者主要用于信息的完整性认证;按水印提取时的条件可分为私有水印(private)、半公开水印(semi-public)和公开水印(public)。私有水印指提取水印时需要原始载体图像,半公开水印指提取水印时不需要原始载体图像,公开水印指提取水印时不需要原始载体图像并且水印是有意义的信息,如一段文字、一幅图像或商标、一段录音等。
Van Schyndel[12]在ICIP’94上发表了题为“A digital watermark”的文章,它是第一篇在主要会议上发表的关于数字水印的文章,其中阐明了一些关于水印的重要概念和鲁棒水印检测的通用方法——相关性检测。此算法首先把一个密钥输入一个m-序列(maximum-length random sequence)发生器来产生水印信号,然后此m-序列被重新排列成2维水印信号,按象素点逐一插入到原始图像象素值的最低位。由于水印信号被安排在最低位上,它是不可见的。基于同样的原因,它可以轻易地被移去,因此是不强壮的。Patchwork算法中描述的Patchwork算法基于改变图像数据的统计特性。该算法随机选取的N对象素点通过增加其一个点的亮度值,相应降低另一个点的亮度值。通过这一调整来隐藏信息。为增加水印的鲁棒性,文中把象素对扩展为小块的象素区域(如8x8),增加一个区域中的所有象素点的亮度值而相应减少对应区域中所有象素点的亮度值。该算法嵌入码低,对串谋攻击抵抗力弱。基于DFT和DWT算法与上述算法具有相似的原理。Hartung[13]提出了一种针对MPEG-2压缩视频数据流的数字水印方案。MPEG-2数据流语法中允许用户数据加到数据流中,但是这种方案并不适合数字水印技术,因为用户数据可以简单地从数据流中去掉。同时,在MPEG-2编码视频数据流中增加用户数据会加大位率,使之不适合固定带宽的应用。所以关键是如何把水印信号加到数据信号,即表示视频帧的数据流中。对于输入的MPEG-2数据流而言,可分为数据头信息、运动向量(用于运动补偿)和DCT编码信号块三部分,Hartung方案只有最后一部分数据被改变。对DCT编码数据块中每一输入的Huffman码进行解码和逆量化,得到当前数据块的一个DCT系数,然后把相应水印信号块的变换系数与之相加,得到水印叠加的DCT系数,再重新进行量化和Huffman编码。对新的Huffman码字的位数n1与原来的无水印系数的码字n0进行比较,只在n1不大于n0的时候才传输水印码字,否则传输原码字。这就保证了不增加视频数据流位率的限制。由NEC实验室的COX等人[14,15]提出的该算法在数字水印算法中占有重要地位。实现方法是:首先以密钥为种子产生伪随机高斯分布N(0,1)序列,密钥一般由作者的标识码和图像的哈希值组成。然后对图像做DCT变换,用伪随机高斯序列调制(叠加)该图像除直流(DC)分量外的1000个最大的DCT系数中。该算法具有较强的鲁棒性、安全性、透明性等,由于采用特殊的密钥,可防止IBM攻击。而且该算法还提出了增强水印鲁棒性和抗攻击算法的重要原则:水印信号应该嵌入源数据中对人眼感觉最重要的部分;水印信号应该由具有高斯分布N(0,1)的独立同分布随机实数序列构成。人的生理模型包括人类视觉系统HVS(Human Visual System)和人类听觉系统HAS。该特性不仅被多媒体数据压缩系统所利用,同样可以供数字水印系统所利用。