多媒体技术基础知识——简要知识点

最新推荐文章于 2025-02-23 19:23:14 发布

jungleli3

最新推荐文章于 2025-02-23 19:23:14 发布

阅读量5.6k

点赞数 3

分类专栏：图像处理文章标签：多媒体技术基础知识

本文链接：https://blog.csdn.net/jungleli33/article/details/17402413

版权

图像处理专栏收录该内容

1 篇文章

订阅专栏

1，常见的视频分类有影像和动画

2，视频信息源

：数字视频信息源：光盘存储设备、数字磁带机、磁盘存储器、彩色扫描仪、数码照相机。模拟视频信息源：摄像机、录像机、传真机。

3，视频输出设备：数字视频输出设备：数字监视器、打印机、绘图机。模拟视频输出设备：电视机、投影电视、大屏幕电视墙、发光管大屏幕、液晶屏幕

4，电视信号主要由图像信号（0-6MHz）和伴音信号(20Hz-20kHz)两部分组成。

5，隔行扫描：隔行扫描需要从上到下扫描两遍完成一幅图像显示，第一遍扫奇数行，称为奇数场；第二遍扫偶数行，称为偶数场。隔行扫描需要两场。

6,逐行扫描：当电视摄像管或显像管中的电子束沿水平方向从左到右、从上到下以均匀速度依照顺序一行紧跟一行地扫描显示图像时，称为逐行扫描。

逐行扫描简单、可靠、图像清晰，但为了保证得到高质量图像，必须要求传输通道具有很宽的频带。

目前在广播电视系统中采用的是隔行扫描方式，而在计算机上采用逐行扫描方式。

7，电视制式：NTSC、PAL、SECAM

8,数字视频的优点：A 数字视频可无失真的多次拷贝，而模拟视频转录误差累计，导致信号失真；B 数字视频便于长时间的存放，而模拟视频长时间存放后视频质量会降低；C 可以对数字视频进行非线性编辑，并可以增加特技效果等；D 数字视频数据量大，在存储与传输过程中必须进行压缩编码；E 数字视频在制作时，分为影像轨和声音轨处理两种模式；F 影像轨播放速度可控制在 18f/s~30f/s，帧速越大，视频呈现越细腻

9，数字视频文件格式：

AVI AVI 格式允许视/音频交错在一起同步播放，支持 256 色和行程编码，不限定压缩标准。AVI 格式只是作为控制界面上的标准，不具有兼容性；用不同压缩算法生成的 AVI 文件，必须使用相应的解压缩算法才能播放出来。

ASF（高级流格式）是 Microsoft 公司 Windows Media 的核心。ASF 是一种数据格式，包括音频、视频、图像及控制命令脚本等信息。ASF 格式的最大优点就是体积小；通过这种格式，以网络数据包的形式传输，实现流式多媒体内容发布。

RealMedia文件 RealNetworks 公司所制定的音频视频压缩规范称为 RealMedia，是目前在Internet 上相当流行的跨平台、客户/服务器结构的多媒体应用标准。采用音/视频流和同步回放技术实现在 Intranet 上全带宽地提供最优质多媒体，同时也能在 Internet 上以 28.8kbps 传输速率提供立体声和连续视频。除了可以普通视频文件形式播放外，还可与 RealServer 服务器配合在数据传输过程中边下载边播放视频影象，而不必像大多数视频文件必须先下载、后播放。

QuickTime 文件 QuickTime 支持 RLE、JPEG 等压缩技术，提供 150 多种视频效果，并配有提供了 200 多种 MIDI 兼容音响和设备的声音装置。为适应 Internet 上网络多媒体应用，QuickTime 为多种流行浏览器软件提供相应的 QuickTimeViewer 插件，在浏览器中实现多媒体数据实时回放。提供自动速率选择功能，当用户通过调用插件播放 QuickTime 多媒体文件时，能选择不同连接速率下载并播放相应图象质量交互式多媒体文件。 QuickTime 以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性，得到业界的广泛认可，目前已成为数字媒体软件技术领域的事实上的工业标准。国际标准化组织 (ISO) 最近选择 QuickTime 文件格式作为开发 MPEG-4 规范的统一数字媒体存储格式。

MPEG 是运动图像压缩算法的国际标准，它采用有损压缩方法减少运动图像中的冗余信息，同时保证每秒30帧的图像动态刷新率。MPEG 压缩标准是针对运动图像而设计的，其基本方法是：在单位时间内采集并保存第一帧信息，然后只存储其余帧相对第一帧发生变化的部分，从而达到压缩的目的。它主要采用两个基本压缩技术：运动补偿技术（预测编码和插补码）实现时间上的压缩，变换域（离散余弦变换 DCT）压缩技术实现空间上的压缩。MPEG 平均压缩比为 50∶1，最高可达 200∶1，压缩效率高，图像和音响质量好，在微机上有统一的标准格式，兼容性好。

10，多媒体计算机可以收看电视节目，计算机处理的视频信号也可以在电视机

中播放。那么这两种不同信号之间的转换过程，是通过什么手段实现的呢？

多媒体计算机的视频转换任务，主要就是针对两种不同系统的颜色空间、帧格式及数据格式的互相转换处理。

11，亮度信号解决了彩色电视机与黑白电视机兼容问题。

12，颜色空间的转换：西欧和中国等使用 PAL 制式，选用 YUV 彩色空间。其中：Y 为亮度信号，U、V 为色度信号；美国、日本等采用 NTSC 制式，选用 YIQ 彩色空间，其中：Y 为亮度信号，I、Q 为色度信号 I、Q 与 U、V 的区别是色度矢量图中的位置不同。人眼分辨红、黄之间颜色变化能力最强，而分辨蓝、紫之间颜色变化能力最弱。在色度矢量图中将人眼最敏感的色轴定义为 I 轴，最不敏感的色轴定义为 Q 轴。在传送 Q (0.5MHz) 信号时可用较窄的频带，而传送 I (1.3~1.5MHz) 信号时可用较宽的频带。

13，帧格式的转换：彩色电视机以扫描线数表示，NTSC 制式为每帧 525 线，PAL 和 SECAM 制式为 625 线。录制或播放电影采用隔行扫描的方式，两遍扫描完成一帧画面的显示。NTSC 制式每秒包含 30 帧，相当于工作在 60Hz 的帧频下，PAL 和 SECAN 制式每秒则为 25 帧，相应频率为 50Hz。

14，数据格式转换：大多数彩电采用模拟信号，要在多媒体计算机中显示，必须进行模/数变换与数/模变换，变换后输出必须与多媒体计算机屏幕显示格式吻合。数据格式转换是视频转换中所要解决的最关键问题。为了完成数据格式转换，就需要使用视频转换卡。

15，从功能上看，视频转换卡主要有三类：视频捕获卡，视频播放卡，电视转换卡。

16，三个重要的多媒体国际标准。

静态图像压缩标准 JPEG、动态图像压缩标准 MPEG 和可视电话和电话会议标准 H.26x 标准。 MPEG视频图像压缩技术的基本思想和方法可以归纳成两个要点：在空间方向上，图像数据压缩采用 JPEG压缩算法 (基于 DCT )，用以减少空域冗余信息。在时间方向上，图像数据压缩采用运动补偿 (Motion Compensation) 算法，用以减少时域冗余信息。

17，颜色空间：RGB、XYZ、YUV、HIS、LAB、CMY

18，图像和图形图像是指绘制、摄制或印刷的形象。表示 “图” 的手段有两种：一种是图像，一种是图形。图像处理是将已有的图像改变成一幅新的、更好的图像。图形：指经

过计算机运算而形成的抽象化结果，由矢量段构成，又称为矢量图。数据量小、线条可圆滑变化

19，显示分辨率和图像分辨率：屏幕上显示图像区域的大小，以“每行像素点数×屏幕显示行数”表示。有最大显示分辨率和当前显示分辨率之分：最大显示分辨率由物理参数，即显示器和显示卡（显示缓存）决定，当前显示分辨率由当前设置的参数决定。图像分辨率是组成一幅图像的像素数，像素点密度，用每英寸多少点（DPI）表示，是一幅图像像素密度的度量方法。对同一幅场景或原图，如果数字化时图像分辨率高，则组成该图的像素点数目越多，看起来就越逼真。图像分辨率在图像输入和输出时起作用。

20，图像深度：描述图像中每个像素数据所占的二进制位数，它决定了彩色图像中可出现的最多颜色数，或灰度图像中最大灰度等级数。

21，颜色类型以 RGB 颜色空间为例，图像深度与颜色的映射关系主要包括真彩色、伪彩色和调配色。真彩色是指图像中的每个像素值都分成 R、G、B 三个基色分量，每个基色分量直接决定其基色的强度，这样产生的颜色称为真彩色。真彩色可以反映原图的真实色彩。伪彩色图像的每个像素值实际上是一个索引值或代码值，该代码值作为颜色查找表 (CLUT) 中某一项入口地址，根据该地址可查找出包含实际 R、G、B 的强度值，这种用查找映射方法产生的色彩称为伪彩色。调配色的获取是通过每个像素点的 R、G、B 分量，分别作为单独的索引值进行变换，经相应的颜色变换表找出各自的基色强度，使用变换后的 R、G、B 强度值产生的色彩。调配色与真彩色相比，相同之处是都采用 R、G、B 分量来决定基色强度，不同之处是前者的基色强度由 R、G、B 经变换后得到，而后者是直接用 R、G、B 决定。

22，矢量图和位图：矢量图也称为面向对象的图像或绘图图像，在数学上定义为一系列由线

连接的点。它是用一系列计算机指令来描述和记录一幅图。用途：用于工程图、白描图、卡通漫画等，这些图形可被分解为单个图形元素，再用一个代数式来表达每个被分解出来的元素。特点：文件数据量小，但对于一幅复杂的彩色照片，很难用数学来描述及用矢量图来表示。位图：也称为点阵或绘制图像，是用像素点描述或映射的图，也即位映射图。位图图像一般也简称为图像。用途：可采用将自然图像进行模数转换的方式获取。一幅位图由许多描述每个像素的数据组成，这些数据作为一个文件存储。特点：表现力强，可以适于任何自然图像，细腻、层次多、细节多。但形成的文件数据量大。通过软件，矢量图可以轻松地转化为位图，而位图转化为矢量图需要经过复杂而庞大的数据处理，而且生成的矢量图像质量不能和原来图形相比拟。灰度图 —— 按照灰度等级的数目来划分，可以表示层次。彩色图 —— 色族丰富，常用的有 RGB 和 CMYK 两种颜色模式

23，图像显示：图像显示器和光栅扫描显示器，

24，颜色实质是一种光波。其存在是因为有 3 个实体：光线、被观察对象和观察者。颜色是观察对象吸收或反射不同波长光波形成的。颜色的三个特性来区分颜色，分别是色调、饱和度和亮度

25，图像信号的数字化，也就是按一定的空间间隔自左到右、自上而下提取画面信息，并按一定的精度进行量化的过程。图像数字化是计算机图像处理中最基本的步骤，其意义就在于把真实的图像转变成计算机所能接受的格式，也就是一连串特定的数字。

26，数字图像的获取：数字图像获取的过程可以分为采样、量化和编码三个步骤。

采样的结果就是通常所说的图像分辨率，

量化的结果则是图像所能够容纳的颜色总数，即图像深度。

采样定理：若对连续图像彩色函数 f(x, y)，沿 x 方向以等间隔 Δx 采样，采样点数为 N，沿 y 方向以等间隔 Δy 采样，采样点数为 M，则得到一个 M×N 的离散样本阵列 [f(x, y)]M´N。为达到由离散样本阵列以最小失真重建原图的目的，采样密度（间隔 Δx 和 Δy）应满足Nyquest采样定理。（当采样频率是图像变化频率的二倍时，就能保证由离散图像数据无失真地重建原图。）

量化原理：量化的意义是指要使用多大范围的数值表示图像采样之后的每一个像素点（即图像深度），这个数值范围包含了图像所能使用的颜色总数。即量化是对每个离散点的灰度或颜色样本进行数字化处理。方法是在样本幅值的动态范围内进行分层、取整，以正整数表示。

编码：在图像数字化后，所转换出来的一连串数值，应该如何存储呢？图像数据有两种存储方式：一个是位映射，另一个是向量处理。

27，图像文件的一般结构：文件头主要包括产生或编辑该图像文件的软件信息及图像本身参数。这些参数必须完整地描述图像数据所有特征，是图像文件中的关键数据。文件体主要包括图像数据，以及彩色变换查找表或调色板数据。这部分是文件的主体，对文件容量的大小起着决定性的作用。文件尾是可选项，可以包含一些用户信息、注释、开发日期、工作时间等。有的文件格式不包括这部分内容。

28，数字图像文件格式：BMP、GIF、TIFF、PNG 、PSD 、PCX、PDF

29，图像数据冗余：空间冗余，时间冗余，结构冗余，知识冗余，视觉冗余，图像区域相同性冗余，纹理统计冗余

30，多媒体技术的基本特征：集成性，交互性和实时性

31，适配卡：声音适配器，即 “声卡”，是普通计算机向多媒体计算机升级的第一个重要配置，其主要作用是处理声音；其基本功能是进行 A/D 转换、进行 D/A 转换、实时动态地处理数字化声音信号的输入/输出。声卡的主要性能指标包括采样频率、量化位数和 MIDI 合成方式。显示适配器，即 “显示卡”，其主要作用是将 CPU 送来的图像信号经过处理再输送到显示器上；其主要任务是规定屏幕图形的显示模式（包括分辨率和彩色数等），完成各种复杂的显示控制。显示卡的主要性能指标是：总线类型、芯片和显示内存。视频卡，即 “视频信号处理器”，(1)主要作用是对视频信号进行实时处理，专门用于播放影视节目；(2)基本特性包括视频输入特性、图形与视频混合特性、图像采集特性、画面处理特性。(3)视频卡按照功能划分，又有视频转换卡、动态视频捕捉卡、视频压缩卡、视频合成卡。解压卡，即 “MPEG卡”，(1)主要作用是对 VCD 等光盘中经过 MPEG 压缩编码的音/视频数据进行解压处理，以便进行视频播放。(2)随着主机 CPU 速度的不断提高，目前市面上各种品牌的计算机都采用软解压技术，即从系统软件中提供解压软件。

32，声音信号所携带的信息大体可以分为语音、音乐和音响三类。

32，声音三特点：音调，音强，音色

33，采样定理：奈奎斯特 ( Nyqust ) 采样定理：只要采样频率大于或者等于信号中所包含的最高频率的两倍；即当信号是最高频率时，每个周期至少采样两个点，则理论上就可以完全恢复原来的信号。

34，采样方法： 1、均匀采样：每个采样周期时长相等。

2、非均匀采样：语音信号频谱在高频处迅速下降，为保持信号的逼真性，可以考虑采样周期时长缩短，整个采样过程中周期不均等。

35，编码：音频模拟信号经过采样与量化之后，为把数字化音频存入计算机，需对其编码，即用二进制数表示每个采样的量化值，完成整个模数转换过程。PCM编码一种最方便简单的编码方法是脉冲编码调制，常称为 PCM (Pulse CodeModulation) 编码。它是一种未经压缩的数字音频信号，常作为一种参考信号，以便其他编码方法与之比较，或在此基础上作进一步压缩编码。衡量编码方法性能有两个主要指标：码流速率和量化噪声

36，数字音频文件格式：WAV波形音频文件，定义：一种最直接的表达声音波形的数字音频文件，主要用于自然声音的保存与重放。特点：声音层次丰富、还原性好、表现力强；如果采样率高，其音质极佳；但数据量大，与采样频率、量化位数、声道数成正比。VOC波形音频文件，特点：由文件头块和音频数据块组成。文件头包含一个标识、版本号和一个指向数据块起始的指针；数据块分成各种类型的子块。 MIDI音频文件，定义：一种计算机数字音乐接口生成的数字描述音频文件，文件中包含音符、定时和多达 16 个通道的乐器定义。特点：文件不记载声音本身波形数据，用数字形式记录声音特征，演奏 MIDI 乐器或重放时，将数字描述与声音对位处理；数据量小。MP3压缩音频文件，特点：压缩比高、数据量小、音质好，压缩比例有 10 : 1、17 : 1，甚至70 : 1；数据率可以是 64kbps，也可以是 320kbps。WMA流式音频文件，特点：相对于 MP3 具有较高压缩率和良好音质。当小于 128kbps 时最为出色且编码后音频文件很小；当大于 128kbps 时音质损失过大。

RA流式音频文件，定义：Real networks 推出的一种音乐压缩格式，其压缩比可达到 96 : 1

因此在网上比较流行。特点：经过压缩的音乐文件可以在通过速率为 14.4kbps 的 Modem 上网的计算机中流畅回访。应用：国际互联网，采用流媒体的方式可以实现网上实时播放，即边下载边播放。 PCM数字音频文件，定义：模拟的音频信号经过模数转换（A/D转换）直接形成的二进制数字序列，该文件没有附加的文件头和文件结束标志。特点：音源信息完整，但冗余度过大；音源信息保存完整，音质好；信息量大，体积大，冗余度过大。

CDA CD-DA音频文件标准激光盘文件，特点：音质好，但数据量大；在 Windows 环境中，用 CD 播放器播放。

37，软件的生命周期包括：①可行性分析和项目开发计划 ②需求分析 ③概要设计 ④详细设计 ⑤软件编码 ⑥软件测试 ⑦软件维护等过程。软件生命周期分三个时期：计划时期 (问题定义和可行性分析)、开发时期 (需求分析、软件设计、软件编码、软件测试) 和运行时期 (软件维护)。

38，软件开发模型：瀑布模型:需求分析——软件设计——软件构造——软件测试——软件维护。缺点：由于它是一种理想线性开发模式，所以缺乏灵活性，特别是无法解决软件需求不明确的问题。螺旋模型

38，平均存取时间

平均存取时间是指从计算机向光盘驱动器发出命令开始，到光盘驱动器在光盘上找到读写信息的位置并接收读写命令为止的一段时间。

光盘驱动器读取光盘的信息时，包括三个时间段：

● 寻道时间：把光学头定位在指定光道半径上所需要的时间；

● 稳定时间：光学头稳定在指定光道上所需要的时间：

● 旋转延时（也称等待时间）：从光学头稳定在指定光道时开始到盘片旋转到指定的扇区所需要的时间。

寻道时间最长，为200~1000ms，光盘的存取时间主要由它来决定；稳定时间一般不长；等待时间一般为60~150ms。

误码率：读出数据中错误信息所占的比例。光存储系统采用了复杂的纠错编码技术，可以降低误码率，但错误还是在所难免。