西文字符的编码-—ASCII
(一)ASCII=美国标准信息交换码(二)标准ASCII:
- 采用7个二进位进行编码
- 共有128个字符,包含96个可打印字符(常
用字母、数字、标点符号等)和 32个控制字符
(三)基本ASCH 与扩展ASCHI的比较:(四)常见字符的ASCH码对照表:
汉字的编码
(一)GB2312
- 1981年我国颁布了第一个汉字编码国家标准GB2312—80 (6763个汉字)
- 组成:
第一部分:字母、数字和各种符号
第二部分:一级常用汉字(共3755个),按汉语拼音排列第三部分:二级常用汉字(共3008个),按偏旁部首排列3.具体实现:
区位码: GB2312国标字符集构成一个二维平面,它分成94行(行号称为区号)、94列(列号称为位号)。每个汉字的区号和位号分别用1个字节来表示。
国标交换码: 每个汉字的区号和位号分别加上32D (0010 0000B)。
机内码(内码): 把一个汉字看作两个扩展ASCII码,在国标交换码的基础上使两个字节的最高位都等于“1”,即分别加上 128D ( 1000 0000B)
(二) GBK
1.1995年发布
2.共有21003个汉字和883个图形符号
3.支持繁体字,包含了中、日、韩认同的全部CJK汉字;4. 双字节编码
5.向下兼容GB2312-80
(三) GB18030
- 2000年发布
- 产生原因:保护我国己有的大量信息资源,既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312和 GBK汉字编码标准
备注:UCS/Unicode: Windows、UNIX、Linux 操作系统和许多最新的软件标准都在使
用UCS/Unicode。 - 共有27000多个汉字(收录字符最多)
- 不等长编码
(四) BIG5:台湾地区的字符编码,不支持简体中文,与GB2312等大陆标准不兼容
(五) GB2312、GBK、 GB18030、UCS/Unicode的比较
文本的准备(输入)
(一) 汉字的键盘输入编码(即汉字的外部码)
- 要求:易学、易记、效率高、重码少、容量大
- 分类:数字编码、字音编码(字音编码)、字形编码(五笔字形)、形音编码
- 注意:用不同的输入编码方法输入同一个汉字,其内码是一样的。
(二)联机手写汉字识别——笔输入设备
(三)印刷体汉字识别输入——扫描仪、OCR
文本的分类
(一)按是否具有编辑排版格式分:
- 简单文本
1)又称为纯文本、ASCII文本,其文件的后缀为“.txt”(文本文件)
2)定义:由一连串用于表达正文内容的字符的编码组成,几乎不包含任何其他的格式信息和结构信息
3)特点:没有字体、字号的变化,不能插入图片、表格、超链接 - 丰富格式文本
1)在简单文本中增加格式控制和结构说明信息
2)标记:用来说明文本的版面结构、内容组织、文字的外貌属性等
3)组成:正文+标记
4)标记语言:
A.普通:RTF
B.网页:HTML(超文本标记语言)、XML(可扩展的标记语言)
5)不同的文字处理软件使用的标记语言不同,Word无法打开“*.pdf”文件
(二)按文本内容的组织方式分:
3. 线性文本
4. 超文本
1)采用网状结构组织信息
2)可以通过导航、跳转、回溯等操作,实现对文本内容更为方便的访问
3)典型代表:Windows中的“帮助”文件(“*.hlp”文件)
(三)按文本内容是否变化和如何变化分:
5. 静态文本:每次访问相同结果
6. 动态文本:文档内容变化(天气查询>
7. 主动文本:持续更新显示文档内容(股票行情查询)
五.文本的编辑、排版与处理
(一)文本的编辑、排版
8. 文本编辑软件“所见即所得”(wYSIWYG)
9. 解决文本的外观问题:使文本正确、清晰、美观
例如:添加页眉和页脚、设置字体和字号、设置行间距,首行缩进3.常用排版软件:PDF Writer、PageMaker、方正飞腾
(二)文本处理
- 对文本中所含文字信息的形音义等进行分析和处理
- 例如:
1)字数统计
2)文语转换
3)文摘生成
4)文本检索
A.工作原理:用户先给出查询要求,然后由文本检索系统将查询近似结果返回给用户
B.分类:
a)关键词检索
b)全文检索:允许用户对文本中所包含的字或词进行查询(查全率高)
C.用于 Web信息检索的搜索引擎大多采用全文检索,使用robot 软件遍历Web上的信
息资源
a)如 Google、Yahoo、天网、搜狐和百度等
b)Web信息是动态变化的,因此搜索引擎要不断的更新索引数据库 - 常用文字处理软件:WPS、Microsoft Word、FrontPage、PDF Writer
微软公司的网页制作软件 FrontPage也是一种功能丰富、操作方便的文字处理软件,它
不仅可以对字体段落进行格式编排,而且能够定义超链。
文本的展现
(一)文本展现过程:
- 对文本的格式描述进行解释
- 生成文字和图表的映像
- 传送到显示器或打印机输出
(二)文本阅读器(浏览器): Word、Acrobat Reader、IE
(三)字型库:
- 间称子厍,同一种子体旳所自子付旳形状拍还信息的集合。
- 字体VS字库:不同的字体(宋体、仿宋、楷体、黑体等)对应不同的字库
- 字符集VS字库:在同一个字符集下,文本的输出所使用的字库不同
- 种不同的字库:点阵描述(计算存储空间)、轮廓描述(Truetype)
计算机图像
(一)定义:从现实世界中通过数字化设备(扫描仪)获取的图
(二)又名:取样图像、点阵图像、位图图像
(三)图像数字化过程:
- 扫描:将画面划分为MxN个网格,每个网格称为一个取样点。
- 分色:将彩色图像取样点的颜色分解成三个基色
- 取样:测量每个取样点每个分量(基色)的亮度值
- 量化:对取样点每个分量的亮度值进行A/D转换
(四)数字图像获取设备:
- 例如:扫描仪、数码相机等
- 基本原理:通过光敏器件(CMOS或CCD)将光的强弱转换为电流的强弱,然后通过取样、量化等步骤,进而得到数字图像
- 可以通过参数设置,得到彩色图像或黑白图像
(五)图像的主要参数:
- 图像大小(图像分辨率)
1)垂直分辨率:矩阵的行数水平分辨率:矩阵的列数
2)像素总数-垂直分辨率X水平分辨率
A.像素:每个取样点
B.像素是组成取样图像的基本单位
3)若图像超过了屏幕(或窗口)大小,则只能显示图像的一部分,使用滚动条可看到全部图像。 - 颜色空间的类型(颜色模型):
1)定义:指彩色图像所使用的颜色描述方法
2)常用的颜色模型:RGB、CMYK、HSB、YUV等(颜色模型可以相互转换) - 像素深度:
1)黑白或灰度图像用1个矩阵表示,彩色图像用多个(一般为3个)矩阵表示
2)定义:像素的所有颜色分量的二进位数之和
3)意义:决定了不同颜色(亮度)的最大数目4)若R 4b、G 4b、B 4b,则最大颜色数目为4096
(六)图像数据量=图像水平分辨率×图像垂直分辨率×像素深度/8(七)数字图像应用:可视电话、卫星遥感、计算机断层摄影(CT)(八)图像压缩
1.可行性:图像中数据相关性很强,人眼的视觉有一定的局限性2.方法:
1)图像压缩方法很多,不同方法适用于不同的应用,一台计算机能使用多种压缩方法。2)优劣评价标准:适用范围、压缩倍数的大小、重建图像的质量(有损压缩时)、压缩算
法的复杂程度
(九)常用图像文件格式
- BMP: Windows使用的标准图像格式,几乎所有 Windows应用软件都支持
- TIF:大量用于扫描仪和桌面出版
- GIF:压缩比(无损压缩)可调,文件特别小——颜色数较少(不超过256色),常用于色彩
数要求不高的场合作为插图、剪贴画等使用,支持透明背景,具有渐进显示功能,形成动画效果,适合网络传输 - JPEG:适用范围最广(国际标准)、可支持有损压缩、主要应用领域之一是数码相机
- JP2:特别采用了小波分析等先进算法,比JPEG好,更适合网上传输
(十)图像处理
- 目的:图像分析、提高图像的视感质量、图像复原和重建
- 通用图像处理软件的基本功能:图像的缩放显示、调整图像的亮度与对比度等、在图片上制作文字等,并与图像融为一体
- 数字图像处理软件:PhotoShop、Microsoft Photo Editor、Photolmapact
计算机图形
(一)定义:使用计算机合成制作的图
(二)又名:矢量图形
(三)过程:使用计算机描述真实(假象)景物的结构、形状与外貌,在需要显示图像的时候,再根据其描述和用户的观察位置及光线的设定,生成该景物的图像。
(四)计算机图形学CG:研究如何使用计算机描述景物并生成其图像的原理、方法与技术
(五)过程模型/算法模型:根据景物的生成规律,并使用相应的算法来描述其规律所建立的模型(如描述树木、花草、烟火、毛发、山脉等)
(六)使用计算机合成图像的主要优点:
- 能生成实际存在的具体景物的图像和假想或抽象景物的图像
- 能生成静止图像和各种运动、变化的动态图像
- 图形文件中只记录生成图的算法和图上的某些特征点,数据量较小
(七)计算机合成图像的应用:
- 计算机辅助设计、设计绘制电路图(最直接的应用)
- 设计制作石油开采地形图
- ―制作天气图等
- 计算机动画
(八)矢量绘图软件:AutoCAD、CorelDraw、Illustrator、FreeHand、Microsoft Visio
声音
(一)声音信号的数字化:
-
定义:将模拟声音信号转换成二进制数字编码形式以便于计算机进行处理的过程
-
过程:
1)取样
A. 声音是一种波,它由许多不同频率的谐波组成,谐波的频率范围称为声音的带宽。
a)全频带声音:20Hz~20KHz
b)言语/语音:人说话的声音,约为300~3400HzB.语音的取样频率8KHz、音乐的取样频率40KHz以上
2)量化
A.本质:AD转换
B.量化精度越高,声音的保真度越好,噪音越低
3)编码
A.经过取样和量化后的声音,还必须按照一定的要求进行编码
B.目的:减少数据量,并按某种格式将数据进行组织
c.IP电话语音信号需要进行数据压缩 -
波形声音获取设备:
1)麦克风:将声波转换为电信号
2)声卡
A.功能:波形声音的获取与数字化、声音的重建与播放、MIDI(乐器指令数字化接口)声音的输入、MIDI声音的合成与播放
B.声卡以数字信号处理器DSP为核心,它在完成数字声音的编码、解码及声音编辑操作中起着重要的作用。
C.声卡能通过话筒输入、线路输入,获取单、双声道声音
D.随着大规模集成电路技术的发展,不少PC机的声卡已经与主板芯片组集成在一起,不再需要做成独立的插卡。
3)数码录音笔
(二)声音重建:
- 过程:解码、数模转换、插值
- 播放过程中必须借助于安装在声卡上的数字信号处理器DSP转换为波形信号
- 音箱一般通过声音卡与主机相连接
(三)波形声音的码率=取样频率×量化位数×声道数
- CD唱片的码率=44.1 kHz×16 bits×2==176.4 KB/s
- CD唱片1小时的数据量=176.4KB/s×60×60=635040KB=635MB
(四)全频带声音的压缩编码
- MP3音乐=MPEG-l audio层3
- 通过专门的软件可以将WAV文件转换成MP3格式
名称 | 压缩后码率 | 声道数目 | 应用 |
---|---|---|---|
MPEG-l audio层1 | 384 kbps | 2 | 数字盒式录像带 |
MPEG-l audio层2 | 256~192 kbps | 2 | DVB、VCD |
MPEG-l audio层3 | 128~112 kbps 10~12倍 | 2 | MP3、inter |
MPEG-2 audio | MPEG-1 1 2 3 5.1, 7.1 | 2 | 数字盒式录像带 |
Dolby AC-3 | 64 kbp 5.1, 7.1 | 2 | DVD, DTV |
3.在移动通信和P电话中,由于信道的带宽较窄,需要采用更有效的语音压缩编码方法。
(五)计算机合成声音
- 语音合成:
1)定义:根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程
2)目前水平~文语转换TTS:按照文本(书面语言)进行语音合成的过程
3)应用:电话信息查询、语音秘书、残疾人服务(有声E-mail服务、有声文稿校对)等 - 音乐合成:
1)声卡上的音源:调频合成器、波表合成器
2)MIDI文件(*.mid)
A.定义:使用MIDI规范表示的音乐(MIDI文件中记录的是乐谱>
B.播放:由PC机中的声卡合成,由 Windows的媒体播放器软件播放(音乐质量受声卡档次影响)
C.优点:文件的数据量很少(比CD少3个数量级,比 MP3少两个数量级)
D.缺点:可表示的音乐不够丰富、无法合成出所有各种不同的声音(例如语音)
视频
(一)定义:内容随时间变化的一个图像序列,伴随有与画面动作同步的伴音。
(二)又叫:运动图像、活动图像
(三)常见视频:电视,电影,计算机动画等
- 电视画面:图像由奇数场和偶数场两部分组成,合起来组成一帧图像。
- 中国采用PAL制式的彩色电视信号
1)帧频25帧/s
2)YUV模式:亮度信号Y和两个色度信号U、V
A. 减少数字视频的数据量:人眼对亮度信号变化的敏感程度较高,所以视频信号数字化时色度信号的取样频率可以比亮度信号的取样频率低一些
B.YUV 与RGB可相互转换
(四)数字视频特性
3. 视频信息中各画面内部有很强的信息相关性
4. 一些视频细节人眼无法感知
5. 视频信息中相邻画面的内容有高度的连贯性
(五)视频信号的数字化
- 视频信号的数字化过程比声音要复杂
- 相关设备:
1)视频采集卡(视频卡):
A.PC机中用于视频信号(有线电视、DV等)数字化的插卡
B.视频卡与显卡的关系:数字化后的视频图像,经彩色空间转换(从YUV转换为RGB),与计算机图形显示卡产生的图像叠加,显示在屏幕上。
C.视频卡一般插在PC机的PCI插槽内
2)数字摄像头:
A.本质:在线数字视频获取设备
B.工作原理:通过光学镜头、CCD器件采集图像,然后直接将图像转换成数字信号并输入到PC机(不需视频采集卡进行A/D转换)
c.接口:USB、FireWire
3)数字摄像机DV—本质:离线数字视频获取设备
(六)数字视频数据量=列数×行数×像素深度/8×帧速×播放时间
(七)数字视频的压缩编码及其应用
- MPEG系列标准
1)MPEG-1 ~ VCD
2) MPEG-2~数字电视和 DVD
3)MPEG-4一交互式多媒体应用
MPEG-4目标:支持各种网络条件下(包括移动通信〉的交互式多媒体应用,侧重于对多媒体信息内容的访问 - MPEG系列标准
- MPEG-1 - VCD
- MPEG-2~数字电视和DVD3) MPEG-4一交互式多媒体应用
MPEG-4目标:支持各种网络条件下(包括移动通信)的交互式多媒体应用,侧重于对多媒体信息内容的访问
2.部分公司标准:
1)微软公司的avi
2)苹果公司的QuickTime - RealNetworks公司的RealVideo
- 流媒体技术:
1)定义:允许在窄带网上让用户一边下载一边收看(听)音视频连续媒体的技术。
2)应用:在线音频广播、实时音乐或视频点播、视频会议
3)代表:微软公司的wmv、ASF
(八)数字视频编辑器(核心软件):Adobe Premiere、VideoStudio 6(绘声绘影)、Windows Movie Maker
(九)动画制作软件:MAYA、3ds max、Animator Pro、Flash
(十)数字视频应用:
- 可视电话(静态图像和动态图像)
- 数字电视
数字电视接收机(DTV接收机)
形式:A.数字电视接收机
B.传统模拟电视机(目前大多数新买的电视机还不能直接支持数字电视的接收与播放)外加一个数字机顶盒
C.可以接收数字电视的PC机 - VOD
又叫:点播电视、视频点播
定义:用户可以根据自己的需要主动收看电视节目