动机
今天在用Python读取txt文件的时候,遇到了一个比较坑的问题,那就是“\n”和“\r”究竟有什么区别?”
历史
在计算机还没有出现之前,人们设计了一种机器叫做电传打字机,这种机器每秒钟可以打10个字符。不过它有个问题,就是打完一行换行的时候,需要0.2s,正好可以打印两个字符,如果这个时候有新的字符传过来,那么这两个新的字符将会丢失。怎么办?研发人员就想了一个办法,在每行后面加上两个表示结束的字符,一个是“回车(return)”,另一个是“换行(newline)”。“回车”表示将打印机的打印头移回到左边界,“换行”表示将打印纸往上推一行(从而达到打印头往下移一行的效果)。
通常我们将“\r”称作回车,而“\n”叫做换行。在Windows中,每行的结尾是“\r\n”,而Linux中,每行的结尾则是“\n”,在Mac中,则只有“\r”。这三者的区别导致了一个现象的发生:将Linux/Mac系统下的文件在Windows中打开时,所有的文字将会变成一行;而将Windows里的文件在Linux/Mac中打开时,则每行的结尾会多一个^M的符号。
知道了文件在不同系统下每行结尾所用的符号差异之后,我们就知道如何解决文件打开的问题了。比如说,如果我们在Windows下打开某个文件,发现所有文字变成一行,那么我们可以使用文本编辑器将里面的所有“\n”或者“\r”换成“\r\n”。
在Python中如何处理
假如有一个txt文件,其中保存了一些数据,我们想要将这些数据读取出来,怎么办?比如:
dat