常见字符编码
-
ASCII码 —ASCII编码表由一个字节表示,128个字符,实际上一个字节可以表示256个字符,但是老外的英文只有那么24个字母,用不了那么多的字符。但是随着计算机的普及,全球都在使用计算机,原本的编码不能够满足全球各国语言,所以出现了Unicode。
-
Unicode—Unicode编码表是固定大小的编码,使用两个字节来表示字符,字母和汉字统一都是占用两个字节,容易造成空间浪费。
-
utf-8—大小可变的编码,字母使用一个字节,汉字使用3个字节。
-
gbk—gbk编码可以表示汉字,而且范围广,字母使用一个字节,汉字2个字节。
-
gb2312—可以表示汉字,gb2312<gbk
注意:
-
WHY? 经常出现的乱码的原因就是因为同一段代码采用的编码和解码的编码格式不同导致乱码的情况。
-
比如Notepad++中的默认编码格式为utf-8,而cmd中的编码格式为gbk,两者默认编码语言不同,无法进行正常编码,所以会出现乱码的现象,就像你听不懂外文是一回事。