计算机系统中文字图片声音,计算机中数字、文字、图像、声音和视频的表示与编码...

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

4 字符编码

编码(或代码)通常指一种在人和机器之间进行信息转换的系统(体系)。编码是人们在实践中逐步创造的一种用较少的符号来表达较复杂信息的表示方法。

4.1 ASCII码

1)ASCII码是使用最多和最普遍的字符编码,即美国信息交换标准代码(American standard code for Information Interchange)。

2)ASCII码有7位码和8位码两种形式 。

3)7位ASCII码:用七位二进制数进行编码的,可以表示128个字符,最高位恒为0。

4)8位ASCII码:用8位二进制数进行编码,可以表示256种字符;当最高位恒为0,与7位ASCII码相同,称为基本ASCII码;当最高位为1时,形成扩充ASCII码,各国一般把该码作为本国语言的字符代码。

4.2 汉字编码

汉字信息所涉及的编码:

4.2.1 汉字输入编码

汉字输入编码的种类:

数字编码:如电报码、区位码等。特点:难于记忆,不易推广;

字音编码:如拼音码等。特点:简单易学,但重码多;

字形编码:如五笔字型、表形码等。特点:重码少,输入快,但不易掌握;

音形编码:如自然码、快速码等。特点:规则简单,重码少,但不易掌握

4.2.2 国际码和区位码

1980年我国颁布了《信息交换用汉字编码字符集基本集》代号为GB2312-80,是国家规定的用于汉字信息处理使用的代码依据,这种编码称为国标码。在国标码的字符集中共收录了6763个常用汉字和682个非汉字字符(图形、符号),其中一级汉字3755个,以汉语拼音为序排列,二级汉字3008个,以偏旁部首进行排列。

所有汉字字符用2个字节表示,高字节共分为94个区(01-94区),低字节分为94个位( 01 -94位), 汉字所在的区号和位号共同组合成该汉字的区位码,区位码为十进制。

非汉字图形字符排在01----15区;

一级汉字排在16---55区;

二级汉字排在56---87区;

例:“中” 区号54、位号48 ,区位码为5448

“国” 区号25、位号90,区位码为2590

国标码的转换:将汉字的区位码表示成16进制,在加上2020H。

即:国标码=(区、位码)16 2020H

4.2.3 机内码

汉字的机内码是计算机系统内部对汉字进行存储、处理、传输统一使用的代码,又称为汉字内码。汉字内码是与ASCII对应的,用二进制对汉字进行的编码。

一般用2个字节来存放汉字的内码,即双字节字符集(double-byte character set,简称DBCS)

4.2.4 矢量、点阵输出输出码

矢量方式存储的是描述字体的轮廓信息。

点阵是对汉字字形经过点阵数字化后的一串二进制数,又称为汉字字形码或字模。

一般显示用16×16点阵,打印用24×24、32×32、48×48等点阵。

点阵越多,打印的字体越好看,但占用的存储空间也越大

4.3 Unicode码

UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。其他实现方式还包括 UTF-16(字符用两个字节或四个字节表示)和 UTF-32(字符用四个字节表示),不过在互联网上基本不用。重复一遍,这里的关系是,UTF-8 是 Unicode 的实现方式之一。

UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。

UTF-8 的编码规则很简单,只有二条:

1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的 Unicode 码。因此对于英语字母,UTF-8 编码和 ASCII 码是相同的。

2)对于n字节的符号(n > 1),第一个字节的前n位都设为1,第n 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值