基础知识总结：字符编码

小球_

于 2017-10-31 10:04:31 发布

阅读量359

点赞数

因为数据是二进制表示的，现在存在各种各样的编码，因为计算机识别的编码与数据本身的编码不一致，就会造成乱码。

ASCII

美国规定的128个字符表示的二进制表示方法，这种方法称为ASCII码，计算机存储的最小单位是字节（8位），ASCII码的后7位表示字符本身，最高位设置为0，后7位0~127表示128个字符，ASCII码对美国够用了，但是对其他国家其他字符远远不够。

ISO 8859-1

西欧编码，这种编码也是一个字节表示一个字符，前127位与ASCII码一样，128到255表示其他的西欧字符。后来推出的Windows-1252就是在其基础上增加了一些数字表示打印字符，一般都用Windows-1252来解析了。

GB2312

主要基于7000个汉字的字符编码，不包括繁体字和特殊字，它用两个字节表示字符，最高位为1，表示汉字。如果最高位是0，则表示ASCII码。

GBK

是在GB2312的基础上增加到21000个汉字，兼容了繁体字。同样用两个字节表示。

GB18030

GB18030再GBK的基础上增加到了76000个字符，兼容了少数民族字符和日韩字符，两个字节的长度已经不能满足这种编码需求了，所以长度增加到4个字节。

Big5

针对台湾和香港的繁体字符集。

乱码是怎样产生的呢？

如果一个文件的字符编码是Windows-1252，如果用GB18030的编码格式来解析的话，就会出现乱码的现象。所以用正确的编码格式编码就可以了。

Unicode

编码跟其他编码不一样，unicode编码给世界上所有的字符都制定了统一的编号，包括110多W，所以可以通过给字符找到对应的unicode编码来找到它真正表示的字符含义，把Unicode编码对应到二级制表中就用到了UTF-32, UTF-16和UTF-8。

UTF-32用字符二进制的完整表示，就是4个字节，因为会造成空间浪费。

UTF-16使用变长自己表示，可能为两个自己可能为4个字节，常用语系统内部编码，比UTF-32节省了空间。

UTF-8就是使用变长字节表示，每个字符使用的字节个数与其Unicode编号的大小有关，编号小的使用的字节就少，编号大的使用的字节就多，使用的字节个数从1到4个不等。UTF-8字符编码兼容ASCii码，一个字符一般用3分字节表示。

所以可以通过Unicode编码实现各种编码的转换，从A编码转换到B编码，可先根据A编码格式找到A对应的映射表找到对应的unicode在通过映射表找到B的编码格式。

博客等级

码龄8年

7
原创

27
点赞

82
收藏

0
粉丝

关注

私信

热门文章

最新评论

spring boot 单体项目集成 spring security 实现登录认证权限认证 jwt token认证
CSDN-Ada助手: 非常感谢CSDN博主分享的关于Spring Boot集成Spring Security实现登录认证、权限认证、JWT Token认证的技术文章。我觉得这样的技术文章对其他用户学习Spring Boot和Spring Security非常有帮助。下一篇博客，我建议可以写一篇关于Spring Boot集成MyBatis-Plus实现CRUD操作的技术文章，相信会有更多读者受益于此。期待更多精彩的技术分享。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
springboot集成mybatis-plus时注入mapper失败的问题
白徽: 但不知道为什么有的需要注明扫描的文件，有的不需要呢（自己可以运行没问题）？
springboot集成mybatis-plus时注入mapper失败的问题
「已注销」: 解决了，包冲突的问题。 mp和mp plus不能同时搞，我把从父项目依赖下来的mp排掉就没问题了
springboot集成mybatis-plus时注入mapper失败的问题
「已注销」: 我排除mybatis plus 的包，就一切正常。加进来就报错。上述配置我都做了。还是报错。我感觉是mybatis plus本身有问题。代码写的不好
springboot集成mybatis-plus时注入mapper失败的问题
最爱你的笑qc: 不错，我是@MapperScan的包名写错了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。