问题:在windows系统中,换行的符号是'\r\n'。python在读文件的时候为了系统兼容,会默认把'\r','n','\r\n'都视作换行。但是在windows文件中,可能在同一行中同时存在'\n','\r\n','\r'。这个时候python的默认行为会将一行拆分成多行输出,影响预期结果。
此时需要设置open函数的newline参数,修改python对换行的默认行为。
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
newline有五种取值:None,'','\n','\r','\r\n'。
在输入过程(从文件到程序),newline用于定义换行的符号:
1.如果newline为None,碰到'\r','\n','\r\n'都算行尾,而且这些符号都会被转换成'\n'。
2.如果newline为'',也是碰到'\r','\n','\r\n'都算行尾,但是这些符号不会发生转换。
3.如果newline为'\r','\n','\r\n',等于是显示指定了换行符,而且行中的符号不会发生转换。
在输出过程(从程序到文件),newline用于指定'\n'的转换符号:
1.如果newline为None,所有的'\n'都被转换成系统换行符。
2.如果newline为'','\n',不会发生转换。
3.如果newline为'\r','\r\n',所有的'\n'会被转换成'\r'或者'\r\n'。
实例一:输出不指定newline,所有的'\n'都被