- 认识编码
计算机中的所有数据都是以二进制的形式存放的,而如何利用01表示出各种文字符号信息等就要使用编码。
以特定的方式把一组特定的字母转换为二进制数据就称为编码。而以此方式把这组二进制数据转换为原来的字母就是解码。
当编码方式与解码方式不统一时就会出现乱码。 - ASCII编码
7位二进制编码
共表示0-127,128个字符
而一个字节是八位二进制,所以可以把128~255之间的空余位置可以进行扩充。
总之 ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。 - iso8859-1
使用一个字节表示一个字符,
最多能表示的字符范围是0-255。
属于扩展的ASCII编码,可以兼容ASCII字符集。 - GB2312字符集
使用2个字节表示,能表示7445个符号 - .GBK字符集
双字节编码,
gbk编码能够用来同时表示繁体字和简体字,而gb2312只 能表示简体字,gbk是兼容gb2312编码的。 - Unicode字符集
针对各国文字、符号进行统一性的编码,共包含65534个字符
UNICODE字符集有多个编码方式,分别是UTF-8,UTF-16,UTF-32。 - utf-8编码
考虑到unicode编码不兼容iso8859-1编码,而且容易占用更多的空间,因此而产生了utf编码。
utf编码是不定长编码,一般来讲,英文字母都是用一个字节表示,拉丁字符需要两个字节,而汉字使用三个字节,极少数辅助字符需要四个字节表示。
字符编码---
最新推荐文章于 2022-07-26 12:05:47 发布