python换行符怎么用_Python 换行符和多行模式

最新推荐文章于 2024-07-16 15:54:41 发布

weixin_39616287

最新推荐文章于 2024-07-16 15:54:41 发布

阅读量3.6k

点赞数

文章标签： python换行符怎么用

本文探讨了Python在多行模式下正则表达式匹配时遇到的不同操作系统换行符问题。在Unix/Linux系统中使用作为换行符时，Python能正确进入多行模式，但在Windows和Mac系统中，和作为换行符会导致匹配失败。通过使用re.sub()函数替换或删除不匹配的换行符，可以确保Python正确识别多行模式。

摘要由CSDN通过智能技术生成

Python 的正则表达式支持多行模式，将每行文字分别匹配。然而各种操作系统里，换行符的表示法各不相同，会导致 Python 不能正确使用多行模式。

目录

花式换行符

不同操作系统下，换行符的表示方法也不同。主要有以下三种：

操作系统

换行符名称

16 进制值

10 进制值

转义表示

Unix、Linux

LF

0A

10

\n

Windows、DOS

CR LF

0D 0A

13 10

\r \n

Mac

CR

0D

13

\r

测试 Python 的表现

如果 Python 不能正确识别换行符，就无法按照期望，进入多行模式的匹配模式。

可以使用下面的脚本来检验各种换行符下，不同版本Python 能否正确进入多行模式。脚本如下：

import re

print(re.findall(r"^\w+$", "hello\r\nbye\r\n", re.M))

如果结果是 ['hello', 'bye'] ，说明正确进入了多行模式；而如果结果是 [] , 则说明没有正常进入多行模式。

测试结果

操作系统

换行符表示

Python 2.7

Python 3.6

Unix、Linux

\n

['hello', 'bye'] ✔

['hello', 'bye'] ✔

Windows、DOS

\r \n

[] ✘

[] ✘

Mac

\r

[] ✘

[] ✘

测试结果说明，只有 \n 这种换行符能成功将 Python 带入多行模式。

如何分辨换行符

那么面对传来的字节流，无论是来自文件、网络，如何知道其中的换行符是上节中的那种呢？我们需要以将字符串用二进制形式表达。

下面这个脚本可以观察字节流的二进制表示：

s=["hello\n","hello\r\n","hello\r"]

for y in s: print(' '.join(format(ord(x), 'b') for x in y))

得到结果为：

1101000 1100101 1101100 1101100 1101111 1010 #\n

1101000 1100101 1101100 1101100 1101111 1101 1010 #\r\n

1101000 1100101 1101100 1101100 1101111 1101 #\r

如何纠正

那么怎么将换行符调整到适合 Python 进入多行模式的呢？可以使用 re.sub() 查找替换函数:

print(re.findall(r"^\w+$", re.sub(r"\r","\n",s), re.M))

或者

print(re.findall(r"^\w+$", re.sub(r"\r","",s), re.M))

将所有的 \r 删除或者替换为 \n ，就能正确识别出换行符。

weixin_39616287

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。