python正则表达式去掉特殊字符_如何在python中使用正则表达式从多行字符串中删除特定字符...

我有一个如下所示的多行字符串:

st = '''emp:firstinfo\n

:secondinfo\n

thirdinfo

'''

print(st)

我正在尝试做的是从我的字符串中跳过第二个':',并获得如下所示的输出:

'''emp:firstinfo\n

secondinfo\n

thirdinfo

'''

简单说,如果它以':'开头,我只想忽略它。

这是我所做的:

mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)

print(mat_obj.group())

显然,我没有看到我的错误,但是谁可以帮助我告诉我哪里出错了吗?

1 Answer:

您可以在此正则表达式中使用re.sub:

>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))

emp:firstinfo

secondinfo

thirdinfo

正则表达式详细信息:

(: 开始第一个捕获组

[^:\n]*: 匹配0个或多个不是:的任何字符和换行符

:: 匹配冒号

[^:\n]*: 匹配0个或多个不是:的任何字符和换行符

\n: 匹配换行

): 结束第一个捕获组

\s*: 匹配0个或多个空格

::匹配一个冒号

(.+): 匹配第二个捕获组中的任何一个或多个字符(换行符除外)

\1\2: 用于替换组1和2中捕获的子字符串。

2 Answer:

您可以改用sub,只是不要捕获不需要的部分。

(.*\n)[^:]*:(.*\n)(.*)

\1\2\3

替换为

import re

regex = r"(.*\n)[^:]*:(.*\n)(.*)"

test_str = ("emp:firstinfo\\n\n"

" :secondinfo\\n\n"

" thirdinfo")

subst = "\\1\\2\\3"

# You can manually specify the number of replacements by changing the 4th argument

result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值