使用str.splitlines()。
splitlines()不同于,可以正确处理换行符split("\n")。
它也具有@efotinis提到的优点,当使用True参数调用时,可以在拆分结果中选择性地包括换行符。
为什么不应该使用的详细说明split("\n"):
\n在Python中,代表Unix换行符(ASCII十进制代码10),与运行平台无关。但是,换行表示形式取决于平台。在Windows上\n是两个字符,CR和LF(ASCII十进制码13和10,AKA \r和\n),而在任何现代Unix(包括OS X)上,它都是单个字符LF。
print,例如,即使您有一个行尾与平台不匹配的字符串也可以正常工作:
>>> print " a \n b \r\n c "
a
b
c
但是,在“ \ n”上进行显式拆分将产生依赖于平台的行为:
>>> " a \n b \r\n c ".split("\n")
[' a ', ' b \r', ' c ']
即使您使用os.linesep,它也只会根据平台上的换行分隔符进行拆分,并且如果您正在处理在其他平台上创建的文本或使用裸露的文本,则会失败\n:
>>> " a \n b \r\n c ".split(os.linesep)
[' a \n b ', ' c ']
splitlines 解决了所有这些问题:
>>> " a \n b \r\n c ".splitlines()
[' a ', ' b ', ' c ']
以文本模式读取文件可以部分缓解换行符表示问题,因为它将Python \n转换为平台的换行符表示形式。但是,文本模式仅在Windows上存在。在Unix系统上,所有文件都以二进制模式打开,因此split('\n')在带有Windows文件的UNIX系统中使用将导致不良行为。同样,使用与其他来源(例如来自套接字)的换行符可能不同的字符串来处理字符串也很常见。