计算机字符编码

计算机是由建立在物理基础上的由晶体二极管构成,由于一个晶体二极管只能呈现高电位或低电位,所以计算机只能识别高低电位,分别用0和1表示。也可以说计算机只能理解0和1这两个数字,所以我们平时用的文本均是通过一些编码方法(如ASCII,Unicode,utf-8)编码成为0、1序列。(即二进制序列)


<1>ASCII编码方法是用一个字节(即8比特)表示一个字符。所以ASCII表示的最大字符转化为十进制就是255。ASCII是美国人发明的所以ASCII编码中只包含一些字母和一些简单的符号。这点字符当然不够全世界这么多的语言字符和特殊符号使用。


<2>由于ASCII编码的缺陷,各个国家都制定了自己的编码方法(如中国制定了CB2312编码方法,日本制订了shift-JIS编码法),这样一来如果在一个文本中混用多种语言就容易出现乱码问题。


<3>Unicode编码方法一般使用两个字节表示一个字符(有的偏僻的字符会用到4个字节表示一个字符),这样Unicode就解决了ASCII编码无法表示更多字符的缺陷和多种字符编码容易出现的乱码问题。


<4>由于Unicode编码方法是用两个字节表示一个字符,如果文本是英文的那么用Unicode编码就不花算,因为英文只要用ASCII编码就行,用ASCII编码占用的字节数只是Unicode的一半。在这样的情况下UTF-8编码方法也就应运而生了,UTF-8编码方法是将英文字母用一个字节表示,汉字通常为三个字节表示(如果遇到偏僻的字可能会用4~6个字节表示一个字符)。对于含有较多英文字符的文本用UTF-8编码就会较Unicode编码节约空间。同时ASCII也可以看成是UTF-8编码的一部分,只支持ASCII编码的软件也可以在UTF-8编码下正常工作。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值