java utf-16l_java 字符集与编码 unicode、utf-8、utf-16

字符集和编码

字符集,是字符的集合,你可以把它当作一本字典,我们都知道字典与字典不一样,比如新华字典只包含汉字,日语字典只包含日语,英语字典只包含英语,而包含世界上全部字符的字典就是unicode,注意,字符集仅仅规定了某个字符的数值,比如,1表示a,2表示b,3表示c,字符集不规定存储传输,那是编码方案的事情。

编码,就是具体的存储、传输方案,比如可以用1个字节表示a,也可以2个字节表示a

等长编码方案:就是用固定的字节数,表示字符集中所有的字符,比如用2个字节表示所有的字符

变长编码方案:某个字符的字节长度是不确定的,比如在字典中,最前边的100个字符用2个字节编码,其余的,用3个字节编码等等。

unicode:它是一种字符集,仅仅是符号的集合,它不包括编码方案

utf-8、utf-16、utf-32:都是unicode的编码解决方案,不同的是,对同一字符,可能使用长度不等的字节数表示,比如,对a,utf-8用1个字节表示,utf-16用2个字节表示,utf-32用4个字节表示,这三种编码方案中有的是变长编码方案,有的是等长编码方案

gbk:gbk是中国推出的字符集,同时也是编码方案,gbk收录了常用的汉字,gbk是等长编码方案,全部用2个字节表示字符

big5:台湾地区推出的字符集兼编码方案

iso8859-1:即是字符集也是编码方案,仅仅包含数字和字母和标点符号,都用1个字节表示

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值