目录
1.1byte=8bit
2.编码表
编码表 | 国家 | 表示 | 缺陷 |
ASCII | 美国 | 1个字符=1个byte=8bit | 会乱码 |
GBK | 中国 | 1个汉字=2个byte=16bit | 会乱码 |
Shift-JIS | 日本 | 会乱码 | |
Unicode | 万国 (全世界) | 普通:1个字符=2个byte 生僻:1个字符=4个byte | 太占内容,浪费空间 |
UTF-8 | 万国 (全世界) | 数字:1~6个byte 英文字母:1个byte 汉字:3个byte 生僻的字符:4~6个byte |
3.现在计算机系统通用的字符编码工作方式
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。