一个ANSI编码的文本文件,在txt编辑器中打开,输入一个Enter,用Hexeditor打开后一看,发现多了两个字节,分别是\r和\n
如果用sublime编辑器里打开,输入一个Enter,用Hexeditor打开后可以发现,和上面是一样的。
此外,对于ANSI编码的文件,文件开头是没有特殊的标记字符的。
下面讨论utf-8编码的文件。
文件头有EF BB BF标记这是一个utf-8编码的文件。
在txt编辑器中输入Enter,用Hexeditor打开后一看,发现多了两个字节,分别是\r和\n。
如果用sublime编辑器里打开,输入一个Enter,用Hexeditor打开后可以发现
unicode存储:文件开头的标记:
如果强行把开头的标记删除,文中有中文的时候,在txt编辑器中进行任意编辑,文件头都会被自动加上EF BB BF的标记,以表示这是一个utf-8 编码的文件。
对于无标记的文件,txt编辑器不可识别\n为换行符,但是sublime编辑器可以识别出这个换行符。
无开头标识的情况下,使用sublime进行换行编辑,输入的将是一个\n,而且更为奇怪的是,sublime还会把之前好好的\r\n替换成\n,这样,整个文件在txt编辑器看来,就只有一行了。