编码大概熟知四种变化即可,即ASCII码、gbk(国标)、Unicode、UTF-8,以下分别描述:
- ASCII码:包含英文字母、数字和标点符号。每个字符用 **** **** 8byte=1字节表示
- gbk:兼容ASCII,也就是说ASCII码包括的内容仍用 **** **** 8byte=1字节表示,然后中文字字符用 **** **** **** **** 16byte=2个字节表示(当然会有一些不常用的字打不出来,后来gbk也进行了扩充,细节之处可以百度百科)
- Unicode:似乎有万国码之称,每个字符都用 **** **** **** **** **** **** **** **** 32byte=4字节表示,当然,这很浪费资源,计算机最注重的之一就是节省资源,所以后来有了改进版的,就是下面这个。
- UTF-8:兼容ASCII码,就是说ASCII码包括的内容仍用 **** **** 8byte=1字节表示,然后大多欧洲的文字用 **** **** **** **** 16byte=2字节表示,大多亚洲文字用 **** **** **** **** **** **** 24byte=3字节表示。(具体细节百度百科)