正则匹配

最新推荐文章于 2023-04-26 09:39:44 发布

kahuifu

最新推荐文章于 2023-04-26 09:39:44 发布

阅读量94

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/kahuifu/article/details/109247630

版权

Python 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

前言

起因是公司小姐姐让我写一个正则匹配去处理数据，之前没怎么用过正则匹配，觉得不会太难，结果在网上一搜我蒙😵了，太杂太乱了，根本找不到我想要的模板，规则又多，总之看的人头疼，短时间内也没有整明白（可能是因为我有压力吧，觉得是一个很简单的任务，越急越写不出来满意的…）主要用的是要分开的字符前不能包含或包含某些特定字符或者该字符后不能包含或包含特定字符。
这类问题可以参考另外的一篇博客：https://blog.csdn.net/jk775800/article/details/90236812?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.add_param_isCf&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.add_param_isCf

非捕获组

这里的问号就是一个非捕获组
例子：匹配前有特殊字符（-）的.

import re
s = '左乳头:底切缘(-).左腋下(6/16)淋巴结见转移癌.'
re_split_pattern = re.compile(r'(((?<=[(-)])|(?<=[\u4e00-\u9fa5]))\.(?=[\u4e00-\u9fa5]))')
result = re.split(re_split_pattern, s)
print(result)

在这里插入图片描述
注意：
①表示或的逻辑的必须要用（）括起来，如下所示，不加（）表示的意思就完全变了：匹配（-）或者前有汉字的.而不是一开始我想要的：匹配前有（-）或汉字的.

re_split_pattern = re.compile(r'((?<=[(-)])|(?<=[\u4e00-\u9fa5])\.(?=[\u4e00-\u9fa5]))')

kahuifu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录