字符集编码小结(ASCII/GB2312/GBK/Unicode/UTF-8/UTF-16)
基本介绍
- ASCII:每个字符占用1个字节,即8位二进制数。
- GB2312:每个字符占用2个字节,即16位二进制数。是我国国标码
- GBK:每个字符占用2个字节,即16位二进制数。是GB2312的扩充
- Unicode:每个字符占用4个字节,即32位二进制数。ISO规定的国际标准字符集,旨在容纳世界上所有的文字和符号,也称万国码。
- UTF-8:英文用1个字节,即8位二进制数。中文用3个字节,即24个二进制数。是Unicode的一种变长编码方式,全称Unicode Transformation Format
- UTF-16: 每个字符占用2个字节,即16个二进制数。是Unicode的一种定长的编码方式
- UTF-32: 每个字符占用4个字节,即32个二进制数。是Unicode的一种定长的编码方式
使用场景
- 中文windows系统默认使用GBK编码
- linux系统默认是UTF-8编码