字符串编码

最新推荐文章于 2023-06-27 19:58:58 发布

小脆脆00

最新推荐文章于 2023-06-27 19:58:58 发布

阅读量3.3k

点赞数

分类专栏：自学文章标签：字符串

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36792770/article/details/116595530

版权

一、字符串编码分为四种

1.ASCII码

为建立英文字符和二进制关系所制定的编码规范，代表了128个字符，包括英文字符，阿拉伯数字，西文字符以及32个控制字符。用一个字节表示具体的字符，但后来只用7位来表示字符（2^7=128）。（一共8位且最前面那位为0）（0000 0000=>0111 1111）

扩展的ASCII码

欧洲部分国家语言中又拼音，7字节不够用。一些国家利用字节中闲置的最高位编入新的符号。这些国家使用的编码体系最多可表达256个字符。同时带来的问题是：不同国家有不同字母，都是用256个字符编码代表的字母依然不一样。例如。130在发育编码中代表了é，希伯来语中代表了字母Gimel (ג)，俄语编码中又代表了另一个符号。但是所有编码在0-127表示的符号是一样的，不一样的只有128-255这段。由于此问题才诞生了Unicode编码。(1000 0000 =>1111 1111)

2.Unicode符号集

一开始是UCS-2字符集最开始可表示2^16（65536字符）

UCS-4 2^36（43亿）

包含世界所有符号，且每个符号都独一无二。比如U+0639表示阿拉伯字母Ain，U+0041表示英文大写字母A，U+4E25表示汉字“严”。

Unicode

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
字符串编码

字符串编码分为四种1.ASCII码为建立英文字符和二进制关系所制定的编码规范，代表了128个字符，包括英文字符，阿拉伯数字，西文字符以及32个控制字符。用一个字节表示具体的字符，但后来只用7位来表示字符（2^7=128）。（一共8位且最前面那位为0）扩展的ASCII码欧洲部分国家语言中又拼音，7字节不够用。一些国家利用字节中闲置的最高位编入新的符号。这些国家使用的编码体系最多可表达256个字符。同时带来的问题是：不同国家有不同字母，都是用256个字符编码代表的字母依然不一样。例如。130..
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。