11_多媒体技术

最新推荐文章于 2024-08-15 22:15:24 发布

梵刹古音

最新推荐文章于 2024-08-15 22:15:24 发布

阅读量929

点赞数 29

分类专栏：嵌入式系统设计师备考笔记文章标签： linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45937810/article/details/140040217

版权

嵌入式系统设计师备考笔记专栏收录该内容

27 篇文章 0 订阅

订阅专栏

多媒体基本概念

媒体的分类

媒体分为以下五大类。

感觉媒体：直接作用于人的感觉器官，使人产生直接感觉的媒体。常见的感觉媒体分为文本、图形、图像、动画、音频和视频。

表示媒体：指传输感觉媒体的中介媒体，即用于数据交换的编码。如文本编码、声音编码和图像编码等。

表现媒体：进行信息输入和信息输出的媒体，也即输入输出设备。如键盘、鼠标和麦克风、显示器、打印机和音响等。

存储媒体：存储表示媒体的物理介质。如磁盘、光盘和内存等。

传输媒体：传输表示媒体的物理介质。如电缆、光纤、双绞线等。

声音

主要用声音的带宽(图2-3-2)来衡量声音的大小，单位是Hz。声音是一种模拟信号，要对其进行处理，就必须将其转化为数字信号。转换过程有三个步骤：采样、量化、编码。

人耳能听到的音频信号的频率范围是20Hz～20kHz。

声音的采样频率一般为最高频率的两倍，才能保证不失真。

(1)数字音乐合成方法。

数字调频合成法(FM):使高频振荡波的频率按调制信号规律变化的一种调制方式。采用不同调制波频率和调制指数，就可以方便地合成具有不同频谱分布的波形，再现某些乐器的音色。可以采用这种方法得到具有独特效果的“电子模拟声”,创造出丰富多彩的声音，是真实乐器所不具备的音色。

波表合成法(Wavetable):将各种真实乐器所能发出的所有声音(包括各个音域、声调)录制下来，存储为一个波表文件。播放时，根据MIDI文件记录的乐曲信息向波表发出指令，从“表格”中逐一找出对应的声音信息，经过合成、加工后回放出来，合成的音质更好。

(2)声音特性。

音高：表示各种声音的高低，主要取决于声波的振动频率，振动频率越高则音越高。音调：表示声音的调子的高低，由声音本身的频率决定。

音色：又称为音品，由声音波形的谐波频谱和包络决定。

声音文件格式：.wav、.snd、.au、.aif、.voc、.mp3、.ra、.mid等。

图形和图像

(1)颜色三要素。

亮度：彩色明暗深浅程度。

色调(红、绿):颜色的类别。

饱和度：颜色的纯度，即颜色的深浅，或者说掺入白光的程度。

(2)彩色空间。即设备显示图片所使用的色彩空间，普通的计算机显示器是RGB色彩空间，除了红、绿、蓝三原色外，其他颜色都是通过这三原色叠加形成的。

电视中使用YUV色彩空间，主要是为了兼容黑白电视，使用的是亮度原理，即调不同的亮度，显示不同的颜色。

CMY(CMYK),印刷书籍时采用的色彩空间，这个采用的是和RGB相反的减法原理，浅蓝、粉红、黄三原色的印刷颜料实际上是吸收除了本身色彩之外的其他颜色的，因此，印刷出来才是这些颜色。

HSV(HSB),艺术家彩色空间，是从艺术的角度划分的。

图像的属性：分辨率(每英寸像素点数dpi)、像素深度(存储每个像素所使用的二进制位数)。

图像文件格式：.bmp、.gif、.jpg、.png、.tif、.wmf等。

DPI:每英寸像素点数。

图像深度是图像文件中记录一个像素点所需要的位数，用来确定图像每个像素可能有的颜色数。

显示深度表示显示器中存储屏幕上一个点的位数(bit),也即显示器可以显示的颜色数。

水平分辨率：显示器在横向上具有的像素点数目。

垂直分辨率：显示器在纵向上具有的像素点数目。

矢量图的基本组成单位是图元，位图的基本组成单位是像素，视频和动画的基本组成单元是帧。

真彩色：指图像中的每个像素值都分成R、G、B三个基色分量，每个基色分量直接决定其基色的强度，这样产生的色彩称为真彩色。

伪彩色：图像的每个像素值实际上是一个索引值或代码，该代码值作为色彩查找表中某一项的入口地址，根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的色彩称为伪彩色。

多媒体相关计算

图像容量计算

(1)已知像素，位数。每个像素为16位，图像为640×480像素，则容量为640×480×16÷8=614400B。

(2)已知像素，色数。640×480像素，256色的图像，则容量为640×480×log₂(256)÷8=307200B。

音频容量计算

音频容量=采样频率(Hz)×量化/采样位数(位)×声道数/8

视频容量计算

视频容量=每帧图像容量×每秒帧数×时间+音频容量×时间

例：使用150DPI的扫描分辨率扫描一幅3×4英寸的彩色照片，得到原始的24位真彩色图像的数据量是( )Byte。

解析：DPI是每英寸像素点数，因此扫描后像素点数为3×150×4×150=270000个，24位彩色图像的含义是每个像素点占24bit=3Byte,因此数据量为270000×3=810000Byte。

常见多媒体标准

JPEG标准和MPEG标准

主要是图像的JPEG标准和视频的MPEG标准，对于MPEG,要掌握每个级别的代表设备标准，具体如图2-3-3所示。

数据压缩基础

数据能够压缩的前提是有冗余，冗余分类如下。

空间冗余(几何冗余):对于一副画面中同样的信息，在压缩时，不需要重复存储，只记录一次信息内容，而后记录这些相同信息出现的位置即可。

时间冗余：在压缩视频时，对于一帧和下一帧，只记录变化的部分，不变的部分不记录。

视觉冗余：例如JPEG标准，就是有损压缩，对于人眼关注不到的细节就不存储，找到一个临界值，达到视觉欺骗的效果。

信息熵冗余：不同的信息编码的冗余效率是不同的，可以通过改变信息编码来改变冗余。

结构冗余：对于结构相同的模块，只记录一次。和空间冗余有点类似。

知识冗余：从知识角度来说，有些可以根据常识推导出来的东西，可以不用记录。

有损压缩和无损压缩

压缩后能够还原的编码方式称为无损压缩(熵编码法):例如WINRAR压缩等，最终可以还原出原数据，最经典的无损压缩就是哈夫曼编码。

压缩后无法还原的编码方式就是有损压缩(熵压缩法):例如JPEG格式的图片。

关注

29
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
11_多媒体技术

本文主要介绍了嵌入式领域中多媒体技术的相关知识点
复制链接

扫一扫

专栏目录

梵刹古音 CSDN认证博客专家 CSDN认证企业博客

码龄5年

35: 原创

114万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

993: 积分

465: 粉丝

641: 获赞

3: 评论

439: 收藏

私信

关注

热门文章

分类专栏

最新评论

13_网络安全
全栈小5: 写的非常详细，是一篇优质博客，干货满满，让我有了全新的认识，感谢博主分享，让我学到了很多，支持支持。【13_网络安全，博主这篇文章，值得一看】
13_网络安全
Kwan的解忧杂货铺@新空间代码工作室: 博主的文章一直都是我的学习圣经，内容详实，通俗易懂，希望博主能一如既往地分享知识，帮助更多人成长。你的博文总是给予我新的思考和启发，真的很感谢你一直以来的辛勤付出。每篇博客都是知识的瑰宝，我真的很喜欢你的风格，期待你的下一次精彩分享。
STM32引脚分类
CSDN-Ada助手: 这篇博客非常有用！你对STM32引脚的分类解释得很清晰，让我对引脚的功能有了更深入的理解。你可以考虑在接下来的博文中扩展一些关于使用JTAG或SW下载引脚的技巧和注意事项，以及如何正确使用晶振引脚作为普通引脚。此外，还可以介绍一些关于电源引脚和复位引脚的更深入知识，例如如何正确连接和使用这些引脚。希望你能继续分享你的知识和经验，期待更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
STM32中的地址偏移
CSDN-Ada助手: 恭喜作者在STM32中的地址偏移方面进行了深入的探讨，这篇博客对于了解STM32的地址偏移具有很大的帮助。希望作者能够继续分享关于STM32的技术知识，或者可以考虑分享一些实际应用案例，让读者更加直观地了解这些知识。谢谢作者的分享，期待您的下一篇作品。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。