数据压缩(在通信系统中称信源编码)是现代社会中信息科技中的关键性技术,也是基础框架性技术。如果没有数据压缩算法,海量的视音频原始数据将无法进行有效的保存,也无法在因特网、无线和有线网络中进行传输。上网看视频,听音乐,在家收看高清数字电视节目等这些日常生活中常见的活动完全离不开数据压缩技术。高效的视音频编解码技术是实现高质量、低成本多媒体数据存储与传输的关键。
数据压缩技术有几个特点:(1)它的发展及应用遵循“标准先行”的策略,国际和国内技术标准的制定不仅前瞻性地预测了应用的需求,同时也为技术研究设定了明确的阶段目标。因此,几十年来该领域的技术发展大大受益于国际标准化活动。MPEG系列和H.26x系列标准是主要的国际信源编解码标准(后面会陆续分析这些标准)。(2)数据压缩技术的研究充分体现出“需求导向”的特点。在工程应用时,通常根据应用的场合(复杂度?低延时?等等)针对需要压缩的信源将若干项技术组合进行设计,对不同性质的信源其压缩技术可能完全不同。因此,如果不分析清楚信源的性质,那么无论是技术的设计还是技术的实现都无从下手。另一方面,人是数据压缩技术最终的服务目标。视音频压缩技术还需要考虑人本身的感知特性,例如,人眼看不清的、人耳听不到的数据就没有必要再进行表示。(3)数据压缩技术的发展并不如其它技术领域那么迅速。例如,二十五年前制定的音频编码标准MP3(MPEG-1 AudioLayer3)仍然是个人娱乐领域的常用格式;同样也是二十多年前制定的静止图像压缩标准(JPEG)仍然出现于大量需要保存图像的应用中。而从最早的MPEG-1和H.261,到现在的H.265,视频编码标准一直保持“变换+量化+预测+熵编码”的混合编码框架。
数据压缩技术发展的这几十年来,相关领域的论文浩如烟海,也有一些相关教材。但从墨妈的教学经历来看,如果将注意力放在比较艰深的理论推导,导致同学们和对视音频技术感兴趣的人们入门较为困难;如果面面俱到而又蜻蜓点水一般地去学习每项技术而不付诸实践,又会由于对技术原理的理解不够深刻,导致在进一步的科学研究和工程应用中产生困难。
墨妈将数据压缩课程的设计分解成本科阶段和研究生阶段。本科阶段的课程是入门课程,抓住两条线:一条线是基础技术原理、技术组合的原理,对优化方法略有提及;另一条线是数据及其分析,即:各种数据压缩的信源格式有什么特点?对数据压缩技术实现过程中的中间数据及最终的数据流格式进行分析。对实验的设计也考虑将这两条线综合起来,理论和实际并重,更为重视算法的实际应用。在完成实验的过程中进行基本的科研训练,当然,顺便把编程的基本功再练习一下!研究生阶段的课程是提高课程,主要分析对于不同信源,所采用的数据压缩技术框架中的编解码优化问题,同时对各类编码标准有更为深入的理解,调试参考代码并根据要求进行算法改进。
本博客开启的主要目标是为中国传媒大学信息工程学院广播电视工程系的大三本科生学习《数据压缩》课程时提供课内教学内容和课外参考资料。同时也希望能为对数字视音频技术感兴趣的娃们提供一条比较简便的学习路径。在课程进行中间,我们还将展示学生的优秀作业和课程设计成果。