今天,我总算搞清楚"回车"(carriage return)和"换行"(line feed)这两个概念的来历和区别了。
在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做"回车",告诉打字机把打印头定位在左边界;另一个叫做"换行",告诉打字机把纸向下移一行。
这就是"换行"和"回车"的来历,从它们的英语名字上也可以看出一二。
后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。
Unix系统里,每行结尾只有"<换行>",即"\n";Windows系统里面,每行结尾是"<回车><换行>",即"\r\n";Mac系统里,每行结尾是"<回车>"。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。
实验 :在Linux下的终端输入:echo -en '12\r\n34\r56\n78' >tmp,我的是ubuntu系统,mac的主题。
然后用vim打开该文件,得到如下图:
如果在终端输入:echo -en '12\n34\n56\n78' >tmp
这样得到的才是正确的回车换行结果,如下图:
所以,在linux中除了'\n'会形成回车加换行的操作,即跳转到下一行的开头。'\r'会变成^M符号。
下面看一下Windows下的结果,在微软系统里面只有,正确的回车换行组合才会完成跳转到下一行的开头的操作,即'\r\n',读起来也是回车换行,其它的:'\r'、'\n'、'\n\r'都不能完成跳转到下一行的操作。
实验,将echo -en '12\n34\n56\n78' >tmp完成的文件在Windows中用记事本打开:
如图:
小黑方块就是不能解析的转移字符,如果是echo -en '12\n\r34\n56\n78' >tmp,那么12后面会出现两个小的黑方块,如果是'\r',那和'\n'是一样的结果,所以除了\r\n'能正确解析,其它的都不行。
我还在Windows下的gVim和Notepad++打开tmp
结果如图:
说明Notepad++自动完成了不同系统的之间回车换行的转换。
总结:回车换行:就是我们在编辑文本是按下ENTER键的效果。所以不同系统下,按下ENTER键,产生不同的操作,Linux和Mac只有一个操作符,而Windows则产生两个操作符。