正则表达式是一种强大的字符串匹配工具,可以在文本中快速定位和提取特定模式的子串。本文将介绍如何使用Python中的正则表达式模块re来实现匹配、截取指定子串并去重的功能。
首先,我们需要导入re模块:
import re
接下来,我们假设有一个字符串,其中包含多个方括号括起来的子串,我们想要提取这些子串并去重。例如:
text = "这是一个[示例]字符串,包含[多个]方括号[子串]。这个[示例]用于演示[正则表达式]的匹配和截取功能。"
我们的目标是从上述文本中提取方括号中的子串,并去重。下面是实现这一功能的代码:
pattern = r"\[(.*?)\]" # 定义正则表达式模式,用于匹配方括号中的子串
matches = re.findall(pattern, text