一、概念解释:
ANSI:并不是某一种特定的字符编码。在不同的系统中,ANSI表示不同的编码(美国同事的系统中ANSI编码其实是ASCII编码(ASCII编码不能表示汉字,所以汉字为乱码),而你的系统中(“汉字”正常显示)ANSI编码其实是GBK编码,而韩文系统中(“한국어”正常显示)ANSI编码其实是EUC-KR编码)
windows系统通过Windows code pages的值来确定当前系统的编码方式(ANSI只存在于Windows系统,不同地区发行的系统,ANSI指代不同)
编码规范和具体编码
字符编码:
1、ASCII编码:早期计算机(美国人造的),用ascii编码(一个字节,8位,可以表示256个编码,实际英语世界里字母、数字和常用符号完全够用)
2、后来,中国人使用计算机,256不够用,中国国家标准总局1980年发布--GB2312。台湾--Big-5
其中收录了6763个常用汉字和682个其它符号(6763+682=7445),并将该字符集分为94个区,每个区9