四者主要区别:
1.ANSI即为ASCII编码,为一个字节,只用到0~127号字符。
2.Unicode编码为万国码,包含几乎世界上的所有字符,一般情况下为两个字节。
3.GBK编码为中国特有编码,但也是在ANSI基础上演变出来的,包含两个字节,其中中文编码与Unicode的中文编码不一样。
4.UTF-8为Unicode的一种实现编码,Unicode编码可以通过一定的规则进行转变。
Window下的记事本编码:
1.Window下的记事本文件开头带有BOM。FF FE表示Unicode编码,即为little endian。FE FF表示Unicode big endian编码。EF BB BF表示UTF-8编码。ANSI开头没有BOM。
2.默认情况下,Window记事本默认编码为ANSI(汉字表示即为GBK编码,0~127号下GBK编码与ANSI编码一样)。
3.默认情况下,记事本编码为ANSI是,只保存“联通”的话,重新打开会出现乱码,原因是计算机把它当成UTF-8编码了。
参考资料:http://my.oschina.net/liting/blog/470021?p=1