运动图像压缩编码标准MPEG
3、MPEG2 主要针对高清晰度电视的需要
l 传输速率为10Mbps,与MPEG1兼容,适用于1.5-60Mbps甚至更高的编码范围。
l 有每秒30帧704×480的分辨率。
l 最为引人瞩目的的产品是数字电视机顶盒与DVD。
4、MPEG4:采用基于模型/对象的第二代压缩编码技术
l 视频对象平面(Vop,Video Object Plane)
l 支持基于视频内容的交互功能。
l 典型应用:DIVX-MPEG4影碟和网上MPEG4电影。
静态图像压缩编码标准JPEG
1、 JPEG确定的目标
l 达到(近乎)完美的图像质量。
l 可以压缩任何连续色调的静止图片,包括灰度和色彩,任意的色彩空间和大多数尺寸。
l 可适用于大部分通用的计算机平台,硬件实现条件适中。
图像准备
像素
pixel
块
block
最小编码单元
MCU
→
图像处理
预测器
prediction
DCT
正变换
→
量化
→
熵编码
行程编码
Huffman
编码
算术编码
JPEG编码的基本处理过程
变换编码原理
变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。
JPEG 与 JPEG2000
l 具有两种编码模式,:离散余弦转换(DCT)和小波转换(Wavelet transform)编码模式。
l 压缩率比JPEG高约30%左右。
l 同时支持有损和无损压缩。
l 能实现渐进传输。
l 支持所谓的“感兴趣区域(Rol,region of interest)”特性。
两种类型的数字音频
1. 计算机声音有两种产生途径
l 一种是通过数字化录制直接获取(波形音频)。
l 另一种是利用声音合成技术实现,可用于语音合成和音乐合成。
2语音合成:文句转语音(Text-To-Speech,TTS)是指将输入的文字或储存于电脑中的文件转换成以清新、流畅、自然的语音输出技术。
3音乐合成:MIDI(乐器数字接口)是在1983年MIDI制造者协会(MMA)提出作为一个控制电子乐器的标准化串行通信协议提出的。
让计算机说话
1、文字-语音转换(Text-To-Speech)
l 把计算机内的文本转换成连续的自然语音流,是语音合成的技术延伸。
文本
↓
预处理
→
语言学处理
→
语音学处理
→
波形编辑合成
→
←
语音数据库
↓
语音
MIDI音乐 (链接:http://www.hudong.com/wiki/MIDI%E9%9F%B3%E4%B9%90)
MIDI(Music Instument Digital Interface)
数字化乐器接口是一个供不同设备进行信号传输的接口标准。MIDI三要素:音源、音序器、输入设备。
声卡
MIDI接口
合成器
音序器
MIDI文件
计算机
MIDI乐器