字符编码简介（ASCII，Unicode，UTF-8等）

最新推荐文章于 2024-04-25 12:31:51 发布

看不见我_不是我_不是我

最新推荐文章于 2024-04-25 12:31:51 发布

阅读量582

点赞数

文章标签： unicode 字符串乱码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35834171/article/details/108437169

版权

一、字节&字符

字节 = 8位的物理存储单元；字符只是一个文化符号
8位（bit，简写b）=1字节（Byte，简写B）

二、ASCII码

0-32：0x20以下的字节状态（16进制） --》控制码
0-127 = 控制码 + 空格、标点、数字、大小写字母 --》ANSI（ASCII编码）
128-255 = 新字母、符号、画表格的横竖线等其他形状 --》扩展字符集
0-255 = ASCII码（0-127） + 扩展字符集（128-255）

三、中文编码（GB2312、GBK、GB18030）

取消掉127之后的符号，2个大于127的字符连接在一起 = 汉字 --》7000多简体汉字、数学符号、罗马希腊字母、日文假名、原ASCII码重编码为两字节 = 全角字符
原来的ASCII码 = 半角字符

半角（0-127） + 全角（2个127以上的字符连接） = GB2312

ASCII码 + 字节1在127以上，字节2不限制 = DBCS（Double Byte Charecter Set 双字节字符集 --》GBK

GBK = GB2312 + 20000个新汉字繁体字和符号
GB18030 = GBK + 几千个新的少数名族的字

四、Unicode & UTF8

ISO（国际标准化组织）重新编码，字符都变为2字节，原来的ASCII码只需要用到低8位，高位补0 --》UCS（Universal Multiple-Octet Coded Character Set） --》Unicode

为解决Unicode的网络传输问题，生出面向传输的 UTF（UCS Transfer Format）标准。Utf-8每次8位传输数据，utf-16每次16个位。Utf-8是一种边长的编码方式，可使用1-4字节表示符号，一个英文字符占1个字节，一个中文字符占3个字节。

UTF8转化算法规则：
单字节的字符：字节的第一位设为0，英文字符=ASCII码。
n字节的字符（n>1）：第一个字节的前n位设为1，第n+1位设为0，后面字节的前两位都设为10，其余空位填Unicode字符，高位补0。
（这里的n字节的字符是指转化为utf-8后的字节数）

utf-8 转化的结果如下：
0xxxxxxx
110xxxxx 10xxxxxx
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

五、遗留问题

~~除非遇到麻烦不会再留意的东西~~
其他字符编码问题
不可见字符
等等

六、参考文章：

https://www.cnblogs.com/yangguoe/p/8467672.html
https://www.zhihu.com/question/23374078
https://www.cnblogs.com/zhcncn/articles/3035561.html

看不见我_不是我_不是我

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

看不见我_不是我_不是我 CSDN认证博客专家 CSDN认证企业博客

码龄8年

9: 原创

76万+: 周排名

180万+: 总排名

1万+: 访问

: 等级

297: 积分

5: 粉丝

8: 获赞

5: 评论

56: 收藏

私信

关注

热门文章

分类专栏

最新评论

EMQ安装、试用（Windows环境）
txl0918: 请问下楼主，你start的时候，有遇到这个问题吗？ $ ./bin/emqx start Could not load module C:\Program Files\erl-23.0\erts-11.0\bin\erlexec.dll. FATAL: Unable to start Erlang (with libcrypto). Please make sure it's running on the correct platform with all required dependencies. This EMQ X release is built for 23.0-win32-64
EMQ安装、试用（Windows环境）
cy谭: 有用，我这边4.X版本，占用的是8081端口，emqx console启动可以看到
EMQ安装、试用（Windows环境）
LLL_N: 解决了我的问题，谢谢
EMQ安装、试用（Windows环境）
---阶梯---: 好东西啊
EMQ安装、试用（Windows环境）
废柴师兄: 良心贴，问题解决了....

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。