正则匹配

前言

起因是公司小姐姐让我写一个正则匹配去处理数据,之前没怎么用过正则匹配,觉得不会太难,结果在网上一搜我蒙😵了,太杂太乱了,根本找不到我想要的模板,规则又多,总之看的人头疼,短时间内也没有整明白(可能是因为我有压力吧,觉得是一个很简单的任务,越急越写不出来满意的…)主要用的是要分开的字符前不能包含包含某些特定字符或者该字符后不能包含包含特定字符。
这类问题可以参考另外的一篇博客:https://blog.csdn.net/jk775800/article/details/90236812?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.add_param_isCf&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.add_param_isCf

非捕获组在这里插入图片描述

这里的问号就是一个非捕获组
例子:匹配前有特殊字符(-)的.

import re
s = '左乳头:底切缘(-).左腋下(6/16)淋巴结见转移癌.'
re_split_pattern = re.compile(r'(((?<=[(-)])|(?<=[\u4e00-\u9fa5]))\.(?=[\u4e00-\u9fa5]))')
result = re.split(re_split_pattern, s)
print(result)

在这里插入图片描述
注意:
①表示或的逻辑的必须要用()括起来,如下所示,不加()表示的意思就完全变了:匹配(-)或者前有汉字的.而不是一开始我想要的:匹配前有(-)或汉字的.

re_split_pattern = re.compile(r'((?<=[(-)])|(?<=[\u4e00-\u9fa5])\.(?=[\u4e00-\u9fa5]))')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值