多媒体信号处理学习随笔

原创 2004年06月28日 14:24:00

    随着计算机的发展以及电子技术的发展,人们进入了MPC(多媒体计算机)时代,人们的生活离不开多媒体计算机,下面是笔者在多媒体处理方面的一些学习随笔,让我们一起来看看多媒体信息是怎样经过计算机处理的。

    要讲到多媒体信息我们还是从我们的现实生活开始吧!世界上的万事万物在人的眼中都是一个与时间紧密相连,是一个连续的模拟的世界。例如:采集来的声波在时间上是一个连续的。我们把这种信号称为模拟信号。再来看看我们的计算机,根据冯诺依曼原理我们说电子计算机是靠电子线路中两个态来工作的,即开关电路惑高、低电平来工作,用它来表示01两个数字,采用访存结构,那么在我们的计算机里面就都是01组成的数字量,我们成为数字信号,它们是离散的,那么这里就存在一个问题,我们采集的模拟信号必须经过A/D(数模转换)才能被我们的计算机所接受,那我们先来看看A/D转换。

在理论上我们采用微积分里面的傅立叶级数来处理数模转换或者模数转换,具体的参考信号处理方面的书籍,我们只看看图表,有一个模拟信号量如图一所示,

图一

我们用一个脉冲信号与它叠加起来如图二所示

图二

就像我们初中学习函数坐标图画法时一样,这条曲线,我们可以用无数多个点表示,描述点越多描述的越象,这些点可以是非周期性的。取样后得到如下图三

图三

这样就变成了数字信号,关于算法才用了傅立叶级数来处理。

 

*引用一段论文里面的材料学习【初仁欣 赵伟 董小刚 数字合成周期信号的频谱及信噪比 清华大学学报 2000 Vol.40 No.1 P.21-24

非均匀采样周期信号的数字频谱

  设g(t)是一个模拟信号,其Fourier变换为模拟信号的频谱Ga(ω),带限为 。 将信号g(t)按照下述方式采样:相邻采样点之间间隔不均等,但每个采样点与其后第M个采样点之间的间隔相等,即总采样周期为MT, T为平均采样周期,如图3所示。

3 信号的非均匀采样

非均匀取样信号的数字频谱可表示为

 

  (1)

式中 rm=(mT-tm)/T 是mT-tm与平均采样周期T的比值。
  设f(t)是一个周期为T0的信号。 f(t)以上述方式被非均匀采样,总采样周期为MT。 f(t)的傅立叶级数可表示为

  (2)

其中: 角频率ω0=2π/T0,且第n阶Fourier级数系数。 f(t)的Fourier变换为

  (3)

  根据周期信号占有频带的确定原则3],取2N1(N1为整数)作为周期信号的占有频带项,式(3)可改写为

  (4)

  由式(1)和式(4)可得

  (5)

式中 fs=1/T为平均采样频率。
  现定义A(n,k)(-∞

  (6)

  则式(5)可写为

  (7)

  式(6)和式(7)即为非均匀采样周期信号的频谱表达式。
  非均匀采样周期信号频谱的性质有: 1) 由式(6)可以看出,序列A(n,k)是k的周期函数,其周期为M, 因此,式(7)中F(ω)是ω的周期函数,周期为2π/T=2πfs; 2) 周期信号被非均匀采样后, Fa(ω)的每根谱线|an|均产生一系列“寄生谱线”;这些“寄生谱线”在频率轴f上均匀分布,且相邻谱线间隔为fs/M。 上述性质表明,非均匀采样后周期信号的第n阶谐波分量在频率轴上位于nω0处,幅值为|A(n,0)|;而“寄生谱线”位于 处(m=1,…,M-1), 幅值为|A(n,m)|。由式(6)可知,有限序列A(n,k)是序列的离散Fourier变换,由Parseval定理可得

  (8)

于是,非均匀采样周期信号的信噪比可写为

  (9)

 

 来看一个实例,我们知道CD音乐的采样频率一般是44.1k,即一秒钟抽样44.1k,一般回放采样字节为16位,当然也有更高的精品CD咯,以16位为例,一秒钟的音乐容量就要176.4KB650M的光盘就能播放61分钟的音乐了,但是达到了很高的音质。

 

        当信号进入到计算机里面后,我们再来看看数字信号是如何在计算机中处理的,举例来看,一张A4幅面(21.6cm×30m)的照片,如果用12/mmdpm)的分辨率,用24位彩色信号表示时的数据量是25MB,这种用数字来直接描述点的图片会非常的清晰,这就是常见的WINDOWS位图文件(.BMP)缺点是图片的容量太大,在网络迅猛发展的今天,这种格式的图片在网络上传输显然不好,于是人们要得到一种容量小,图像清晰的格式,常见的有静态图像小组(.JPG,来分析BMP图片,我们可以将其中的一小部分抽出来,其余的略去,这样的到的图片清晰度降低了,同时图片的容量大大减少了,对于人的眼睛来说,分不出BMP图片与JPG图片的清晰度,只有在放大图片的时候,才能分出图片的质量,我们称这种图片的压缩为有损压缩。来详细分析一下JPEG技术,现有的JPEG技术采用的是离散余弦变换算法(DCT)在平稳过程中将图像数据压缩成正方形8×8的“象素信息模块”并按照一定顺序排列存储形成压缩文件,经过多次压缩后,图像文件只保留最为重要的数据信息,而肉眼当然是分辨不出来。另外还有一种方式是离散子波(wavelet)变换算法,它采用频域或时域局部考察方式,即在信号分析中对高频成分采用由粗到细的时空域上进行取样,所以能构造出远景的高清晰度,这种算法对JPEG压缩比有较大提高,但是还是有损压缩。这种压缩还应用在视频处理上。

        作为新一代图片格式JPEG 2000采用了预测法作为图像进行无损编码方式。使之能实现无损压缩(loseless compression)或交互压缩(保留某一部分图像低压缩比以求清晰度)。作为无损压缩的代表,我们来看看日常生活中常见到的GIF图片格式,它采用LZ算法来实现。来看看LZ算法,它是一种词典编码方式,建立在LempelZiv发表的算法,所以称为LZ算法,它包括;LZSSLZWLZ77等,都是无损算法。

(未完)

 

网络安全学习笔记

跨站脚本攻击(XSS Cross Site Script)     一、定义:黑客通过“HTML注入”篡改了网页,插入了恶意的脚本,从而在用户游览网页时,控制用户游览器攻击的一种行为。     二、分...
  • qwe6112071
  • qwe6112071
  • 2016年03月05日 00:46
  • 819

汇编学习笔记(一)

这只是我学习汇编时候为了防止自己忘记的笔记系列,所以可能没什么条理性,基本上算是0基础开始吧,如果你也要学习,希望对你有帮助(目前会极其没有条理,后来会整理发出来)。 之前写kiwi系列(现在还没有...
  • sium__
  • sium__
  • 2016年03月01日 12:24
  • 546

《语音信号处理》学习笔记

《语音信号处理》学习笔记一、基本概念 语言:从人们的话语中概括总结出来的规律性符号系统。 语音:一连串音组成的声音。 音节:具有一个响亮的中心,并被明显感觉到的语音片段。 音素:发音最小片段。分为元音...
  • by21010
  • by21010
  • 2015年09月19日 17:39
  • 849

数字语音信号处理学习笔记——语音信号的短时时域分析(4)

基于能量和过零率的语音端点检测&基音周期估值
  • u013538664
  • u013538664
  • 2014年05月18日 14:39
  • 2230

高清晰度多媒体接口, HDMI 1.4介绍

高清晰度多媒体接口, HDMI 1.4介绍 FOLLO 高清晰度多媒体接口(High Definition Multimedia Interface,简称HDMI)是一种全数字...
  • u010783226
  • u010783226
  • 2016年07月19日 09:28
  • 789

初次使用七牛多媒体云存储

我是个纯客户端开发者,为什么强制一个字“纯”呢?因为我不懂服务器端,...
  • fuyulinglynn
  • fuyulinglynn
  • 2014年07月23日 14:49
  • 962

关于FPGA设计数字信号处理电路的心得

FPGA使用的越来越广泛,除了可用于设计控制电路以为,数字信号处理电路更是FPGA的强项和难点。个人可以说才刚刚入门FPGA设计,也做过一些数字信号处理方面的电路设计,记录下个人心得体会。 (一...
  • lijiuyangzilsc
  • lijiuyangzilsc
  • 2014年11月25日 11:29
  • 1454

推荐一本学习IOS开发的书籍

《 iOS开发指南
  • Angle1ove
  • Angle1ove
  • 2014年10月27日 13:24
  • 1415

多媒体处理开源库

转自:http://sigmm.org/Resources/software/projects Advene: aims at providing a model and a format to...
  • Garfield2005
  • Garfield2005
  • 2016年09月27日 10:33
  • 787

现代数字信号处理总结 上

本博客全部参考于UESTC电工学院何子述老师讲义复习而得,如有转载请保留此句!...
  • u013457167
  • u013457167
  • 2017年07月03日 18:17
  • 566
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:多媒体信号处理学习随笔
举报原因:
原因补充:

(最多只允许输入30个字)