记录一些python正则匹配的实际应用场景示例,持续更新。
测试环境:python3
1. 目标场景: 提取不跟在特定字符后的指定字符
示例问题:
血氧饱和度提取 输入字符形式类似 “SpO296”或者“SPO296”
96 为目标数值,SpO2 中的O2为氧气 。所以问题可以转化为提取连续的数字,数字前的字符不能是SpO 或者SPO.
示例代码:
input_str='SpO296'
import re
match_obj = re.search(r'(?<!SPO|SpO)\d+', input_str)
if match_obj:
print(match_obj.group())
提取结果为: 96
2.目标场景: 时间描述抽取
示例问题:
抽取一段文本中的全部时间点,形式为’xxx前’
例如:3天前,数日前,15分钟前 等等
示例代码
text_str='20余天前,xxx,数星期前,3天前,4天前,几分钟前'
import re
pattern=r'[\d数半几]+[余]*[天|日|星期|周|月|年|小时|分钟]+[余]*前'
res = re.findall(pattern,text_str)
print(res)
提取结果为: [‘20余天前’, ‘数星期前’, ‘3天前’, ‘4天前’, ‘几分钟前’]