python正则表达式去掉特殊字符_如何在python中使用正则表达式从多行字符串中删除特定字符...

最新推荐文章于 2022-12-29 12:31:21 发布

weixin_39996134

最新推荐文章于 2022-12-29 12:31:21 发布

阅读量1.3k

点赞数

文章标签： python正则表达式去掉特殊字符

我有一个如下所示的多行字符串：

st = '''emp:firstinfo\n

:secondinfo\n

thirdinfo

'''

print(st)

我正在尝试做的是从我的字符串中跳过第二个'：'，并获得如下所示的输出：

'''emp:firstinfo\n

secondinfo\n

thirdinfo

'''

简单说，如果它以'：'开头，我只想忽略它。

这是我所做的：

mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)

print(mat_obj.group())

显然，我没有看到我的错误，但是谁可以帮助我告诉我哪里出错了吗？

1 Answer:

您可以在此正则表达式中使用re.sub：

>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))

emp:firstinfo

secondinfo

thirdinfo

正则表达式详细信息：

(: 开始第一个捕获组

[^:\n]*: 匹配0个或多个不是:的任何字符和换行符

:: 匹配冒号

[^:\n]*: 匹配0个或多个不是:的任何字符和换行符

\n: 匹配换行

): 结束第一个捕获组

\s*: 匹配0个或多个空格

::匹配一个冒号

(.+): 匹配第二个捕获组中的任何一个或多个字符(换行符除外)

\1\2: 用于替换组1和2中捕获的子字符串。

2 Answer:

您可以改用sub，只是不要捕获不需要的部分。

(.*\n)[^:]*:(.*\n)(.*)

\1\2\3

替换为

import re

regex = r"(.*\n)[^:]*:(.*\n)(.*)"

test_str = ("emp:firstinfo\\n\n"

" :secondinfo\\n\n"

" thirdinfo")

subst = "\\1\\2\\3"

# You can manually specify the number of replacements by changing the 4th argument

result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

weixin_39996134

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python正则表达式去掉特殊字符_如何在python中使用正则表达式从多行字符串中删除特定字符...

我有一个如下所示的多行字符串：st = '''emp:firstinfo\n:secondinfo\nthirdinfo'''print(st)我正在尝试做的是从我的字符串中跳过第二个'：'，并获得如下所示的输出：'''emp:firstinfo\nsecondinfo\nthirdinfo'''简单说，如果它以'：'开头，我只想忽略它。这是我所做的：mat_obj = re.match(r'(....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。