如何在python中使用正则表达式从多行字符串中删除特定字符

最新推荐文章于 2023-10-20 14:48:02 发布

Python热爱者

最新推荐文章于 2023-10-20 14:48:02 发布

阅读量813

点赞数

文章标签：编程语言 python

原文链接：https://www.jianshu.com/u/8f2987e2f9fb

版权

我有一个如下所示的多行字符串：

st = '''emp:firstinfo\n
       :secondinfo\n
       thirdinfo
     '''
print(st)

我正在尝试做的是从我的字符串中跳过第二个’：’，并获得如下所示的输出：

 '''emp:firstinfo\n
   secondinfo\n
   thirdinfo
   '''

简单说，如果它以’：'开头，我只想忽略它。

这是我所做的：

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：778463939
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)
print(mat_obj.group())

显然，我没有看到我的错误，但是谁可以帮助我告诉我哪里出错了吗？

1 Answer:

您可以在此正则表达式中使用re.sub：

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：778463939
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))
emp:firstinfo
secondinfo
 
       thirdinfo

正则表达式详细信息：

(: 开始第一个捕获组
[^:\n]*: 匹配0个或多个不是:的任何字符和换行符
:: 匹配冒号
[^:\n]*: 匹配0个或多个不是:的任何字符和换行符
\n: 匹配换行
): 结束第一个捕获组
\s*: 匹配0个或多个空格
::匹配一个冒号
(.+): 匹配第二个捕获组中的任何一个或多个字符（换行符除外）
\1\2: 用于替换组1和2中捕获的子字符串。

2 Answer:

您可以改用sub，只是不要捕获不需要的部分。

(.*\n)[^:]*:(.*\n)(.*)

在这里插入图片描述

\1\2\3

替换为

import re
 
regex = r"(.*\n)[^:]*:(.*\n)(.*)"
 
test_str = ("emp:firstinfo\\n\n"
    "       :secondinfo\\n\n"
    "       thirdinfo")
 
subst = "\\1\\2\\3"
 
# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

Python热爱者

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何在python中使用正则表达式从多行字符串中删除特定字符

我有一个如下所示的多行字符串：st = '''emp:firstinfo\n :secondinfo\n thirdinfo '''print(st)我正在尝试做的是从我的字符串中跳过第二个’：’，并获得如下所示的输出： '''emp:firstinfo\n secondinfo\n thirdinfo '''简单说，如果它以’：'开头，我只想忽略它。这是我所做的：'''遇到问题没人解答？小编创建了一个Python学习交流QQ群：7
复制链接

扫一扫