编码方式ASCII、GBK、Unicode、UTF-8比较

心情:

写代码经常遇到中文乱码问题,很烦,一气之下总结了各种编码方式(O`-`O)!!

文章内容深度较浅,详细了解可到下链接:https://blog.csdn.net/QuinnNorris/article/details/78705723;

总结了以下几种编码方式:

ASCII、GBK(GB2312、GB18030)、Unicode、UTF-8

ASCII

American Standard Code for Information Interchange

最早的编码,一个字符一个字节。没有中文字符,用这个编译中文就会乱码。

一个字节8个比特,最多表示127个字符,2^7=128,7位编码。

后来有个扩展的,有256个字符,但不是国际标准。

GBK、GB2312、GB18030

中文编码,两个字节,第一个字节最高位是1。

不同国家各有标准,如,日文:Shift_JIS、韩文:Euc-kr。

Unicode

全球统一编码,包含所有国家语言的字符。
2字节,英文第一个字节是0,所以大量英文字会浪费空间。

UTF-8

变长编码,灵活“容错率”强,可为1字节可为2字节,1-4字节。

英文上,UTF-8与ASCII一样。

中文用了三个字节。

单字节0开头,双字节110..10..开头,三字节1110..10..10..开头。

转载于:https://www.cnblogs.com/foxer-z/p/10805283.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值