码表

常见的码表如下:

ASCIIa-->97       美国标准信息交换码。用一个字节的7位可以表示。


ISO8859-1   拉丁码表。欧洲码表,用一个字节的8位表示。又称Latin-1(拉丁编码)西欧语言ASCII码是包含的仅仅是英文字母,并且没有完全占满256个编码位置,所以它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入192个字母及符号,

藉以供使用变音符号的拉丁字母语言使用。从而支持德文,法文等。因而它依然是一个单字节编码,只是比ASCII更全面。


GB2312   英文占一个字节,中文占两个字节.中国的中文编码表。


GBK      中国的中文编码表升级,融合了更多的中文文字符号。


Unicode  国际标准码规范,融合了多种文字。所有文字都用两个字节来表示,Java语言使用的就是unicode


UTF-8    英文存的是1个字节,中文存的是3个字节,最多用三个字节来表示一个字符。


UTF-16: 不管英文中文都是占2个字节。


(我们以后接触最多的是iso8859-1gbkutf-8

查看上述码表后,很显然中文的iso8859-1中是没有对映的编码的。或者一个字符在2中码表中对应的编码不同,例如有一些字在不同的编码中是有交集的,例如bjg5 gbk 中的汉字简体和繁体可能是一样的,就是有交集,但是在各自码表中的数字不一样。

例如

使用gbk 将中文保存在计算机中,

      

对映  100  200   如果使用big5 打开

可能   ...  

不同的编码对映的是不一样的。

很显然,我们使用什么样的编码写数据,就需要使用什么样的编码来读数据。

ISO8859-1:一个字节

GBK: 两个字节包含了英文字符和扩展的中文   ISO8859-1+中文字符

UTF-8 万国码表,推行的。是1~3个字节不等长。英文存的是1个字节,中文存的是3个字节,是为了节省空间。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值