理解 GBK、Unicode、utf-8
彻底理解 GBK、Unicode、utf-8
首先说明字符集:
字符集仅仅是字符的集合,规定了每个字符的码位(也就是它们的位置), 并没有规定具体的编码方式
编码方式
将字符编码成 具体的二进制码,像gbk2312既是字符集又是具体的编码方式;Unicode是字符集,底下的utf-8才是具体的编码方式
gb2312 编码
1981年5月1日发布的简体中文汉字编码国家标准。收录7445个图形字符,其中包括6763个汉字。GB2312对汉字采用双字节编码。在进行编码之前应先设计字符集,就像ASCII码字符集
原创
2021-09-23 21:33:25 ·
860 阅读 ·
0 评论