关于字符编码

最新推荐文章于 2023-02-27 08:00:00 发布

zhaojiabo1997

最新推荐文章于 2023-02-27 08:00:00 发布

阅读量182

点赞数

分类专栏：基础知识文章标签：计算机系统字符编码

基础知识专栏收录该内容

1 篇文章 0 订阅

订阅专栏

ansi <127 单字节，半角
GB2312 是对 ASCII 的中文扩展。双字节，全角 >127,127-255
gbk GBK包括了GB2312 的所有内容，同时又增加了近20000个新的汉字（包括繁体字）和符号。 >127,随便
gb18030 又加了几千个字
统称“DBCS“（Double Byte Charecter Set 双字节字符集
Unicode 废了所有的地区性编码方案，重新搞一个包括了地球上所有文化、所有字母和符号的编码！“字节”是一个8位的物理存贮单元，而“字符”则是一个文化相关的符号。在unicode中，一个字符就是两个字节。从unicode开始，无论是半角的英文字母，还是全角的汉字，它们都是统一的”一个字符“
UTF-8就是每次8个位传输数据，而UTF-16就是每次16个位。UTF-8就是在互联网上使用最广的一种unicode的实现方式，unicode一个中文字符占2个字节，而UTF-8一个中文字符占3个字节

最后简单总结一下：

中国人民通过对 ASCII 编码的中文扩充改造，产生了 GB2312 编码，可以表示6000多个常用汉字。
汉字实在是太多了，包括繁体和各种字符，于是产生了 GBK 编码，它包括了 GB2312 中的编码，同时扩充了很多。
中国是个多民族国家，各个民族几乎都有自己独立的语言系统，为了表示那些字符，继续把 GBK 编码扩充为 GB18030 编码。
每个国家都像中国一样，把自己的语言编码，于是出现了各种各样的编码，如果你不安装相应的编码，就无法解释相应编码想表达的内容。
终于，有个叫 ISO 的组织看不下去了。他们一起创造了一种编码 UNICODE ，这种编码非常大，大到可以容纳世界上任何一个文字和标志。所以只要电脑上有 UNICODE 这种编码系统，无论是全球哪种文字，只需要保存文件的时候，保存成 UNICODE 编码就可以被其他电脑正常解释。
UNICODE 在网络传输中，出现了两个标准 UTF-8 和 UTF-16，分别每次传输 8个位和 16个位。于是就会有人产生疑问，UTF-8 既然能保存那么多文字、符号，为什么国内还有这么多使用 GBK 等编码的人？因为 UTF-8 等编码体积比较大，占电脑空间比较多，如果面向的使用人群绝大部分都是中国人，用 GBK 等编码也可以。

来自：https://www.zhihu.com/question/23374078

http://www.qianxingzhem.com/post-1499.html

更多：https://wenku.baidu.com/view/cbb11a176edb6f1aff001f8d.html?sxts=1523715864119

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zhaojiabo1997 CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

55万+: 周排名

189万+: 总排名

7万+: 访问

: 等级

282: 积分

10: 粉丝

46: 获赞

5: 评论

74: 收藏

私信

关注

分类专栏

python 5篇
基础知识 1篇
c 3篇

最新评论

-> 在c语言中是什么意思？
weiwei！！: 通俗易懂
-> 在c语言中是什么意思？
留_痕: 感谢解惑
关于对hanoi塔递归的理解
菜到无药可救: 写的太好了，喜欢这种文章，有趣！递归的理解要点在于放弃！放弃你对于理解和跟踪递归全程的企图，只理解递归两层之间的交接，以及递归终结的条件。跟踪全程，人脑是不可能做到的。那么我们只要搞清楚其中的递归条件（hanoi问题的求解方式是递归的）和终结条件
关于可变对象与不可变对象，变量
嘉戈: 感谢分享
python中的re.split()
艾宾浩斯的美酒: 使用()会出现优先级，本来按 m = re.split( '\d+' , 'acb123def456ghi') print(m) 划分使用括号，优先级内的东邪会跑出来，所以 import re m = re.split( '(\d+)' , 'acb123def456ghi') print(m) ['acb', '123', 'def', '456', 'ghi'] ，我们可以通过加？:禁用优先级 import re m = re.split( '(？:\d+)' , 'acb123def456ghi') print(m) ['acb', '123', 'def', '456', 'ghi']

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。