文本编码格式主要:ASCII,GBK,GB2312,UNICODE,UTF-8;
ASCII: 最初发布,包含空格、标点符号、数字、大小写字母和控制符;一字节;
GB2312:6000多个常用汉字的编码,仅国内使用;
GBK:在GB2312基础上扩展繁体和符号;
UNICODE:IOS,国际标准化;两字节;
UTF-8:1-6字节,英文按照ASCII,汉字通常是3字节;
英文较多时,使用ASCII/UTF-8编码节省空间;汉字较多时,使用UNICODE;
为了方便区别文本的编码格式,使用BOM头(不显示字节)进行区分;
ASCII:无;
UNICODE:FFFE; BIG ENDIAN : FEFF;
UTF-8:EFBBBF;
扩展:
1.window 记事本 联通,保存,再次打开 乱码?
辅助:
notepad++,ultraedit;