python文件IO不同系统下换行符问题的分析及处理

       在文件IO中,不同系统平台对于换行符的默认值是不一样的,在windows下,默认换行符是\r\n,在linux下,默认换行符是\n,在mac os下,默认换行符是\r。在不同的平台上,当我们用notepad++以‘显示所有字符’的方式打开在相应平台上使用默认换行符生成的文件时,可以看到,在windows下,每行的末尾是CR LF,在linux下行尾是LF,而在mac os下则是CR。对默认于换行符,不同的系统是不一样的,有时候,为了不同系统下的可移植性,我们需要改变文件中默认的换行符,而有时候,为了保持系统的兼容性,我们又需要使用系统默认的换行符,以兼容该系统下的其他应用。

       首先,在python内部,换行符是\n,这对于所有的系统来说都是一样的,不同的是当我们生成文件时,不同的系统对换行符的处理是不一样的。比如,我们要新建一个文件并写入,那么在文本模式下,即't'模式下,windows系统下python会在写入时自动把\n转为\r\n;在读取时,windows系统下python也会自动的把\r\n转为\n。这样看来,对于python程序而言,似乎并不会有什么影响,因为基于不同的系统,python都会自动的把不同系统下的换行符进行转换,最终在程序内得到的换行符始终是\n,但是问题在于,我们在不同系统下得到的文件中的换行符是不一样的。比如,当我们把在windows下用默认换行符生成的文件转移到linux系统下用vim打开的时候,每行的末尾都会有一个^M标记,这就是因为windows下的默认换行符\r\n在linux下不兼容造成的;有时候我们还会对文件进行跨平台处理,比如在windows下生成的文件放到linux下用python处理,这时也要考虑换行符问题。

       如何解决这个问题呢?实际上,我们并不能找到一种生成可以兼容所有平台的文件,只能是针对不同的平台生成相应兼容的文件。当然,如果是在同一个平台上,我们只需要用默认的方式生成就好了,问题在于,如果我们想要在windows系统下生产兼容linux系统的文件,或者在Linux系统下生成兼容windows系统的文件,该如何处理?

       首先,我们要知道,这里换行符自动转换的处理时python执行的,而且是在文本模式的读写操作下,python在对字符串编码解码的时候执行的,所以对于二进制模式,python并不会对换行符进行转换处理。因此,如果我们是以二进制模式写入的话,那么其实生成的文件打开的时候的换行符是python内部的换行符\n,不会自动转换,只有在文本模式下才有换行符自动转换这个问题存在。所以,如果我们要在windows系统下生产兼容linux系统的文件,只需要以二进制模式写入就可以了。而若要在linux下生成兼容windows系统的文件,可以先将\n替换成\r\n后再以二进制模式写入。

       如果是对windows下已经默认生成的文件放到linux下用python处理,那么可以先对文件做一下预处理,即把文件先全部读取后将\r\n替换成\n,然后再处理文件,反过来也一样。

       在python2中,对于跨平台文件换行符问题的处理,因为对于python本身而言,主要是在读取时存在问题,所以可以利用universal newlines mode,即'u'模式下读取,该模式只支持读取,该模式下,会把文件中不同平台的换行符\r,\n,\r\n都统一转为\n,不管是在什么平台上处理何种换行符的文件。在python3中,提供了更为简单和友好的处理方式,那就是在open函数中,通过newline参数指定换行符,这样我们可以轻松的处理不同平台下生成的文件以及生成特定平台兼容的文件。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值