正则表达式“或”,写规则提取文章里面的实体关系。

一开始用下面的代码去匹配类似"华为将与高通在通信领域建立合作"的句子,e1和e2是用nlp工具提取出来的组织或机构名,后来发现存在否定前缀的反例,“没有与…合作”于是增加反例的排除条件,即op_result的匹配。但是返回结果出错,匹配到的都是正例。
错误示例:

result = re.search(e1+'(.*?)[和与跟(协同)](.*?)'+e2+'(.*?)合作', sentence)
op_result = re.search(e1+'(.*?)[(没有与)(没有和)(没有跟)](.*?)'+e2+'(.*?)合作', sentence)

后来找到了“或”的写法,正确代码如下:

result = re.search(e1+'(.*?)(与|和|跟|协同)(.*?)'+e2+'(.*?)合作', sentence)
op_result = re.search(r''+e1 + '(.*?)(没有与|没有和|没有跟)(.*?)' + e2 + '(.*?)合作', sentence)

还有一个坑是在表达式前加r,因为有了变量,所以不能直接加r,要写成r’’+e1这种形式,注意此处是两个单引号

https://www.itdaan.com/blog/2010/11/03/7d81b73342a1bc80ce9f4ddce3e03264.html

“或”是正则表达式灵活性的重要体现,我们可以规定某个位置的文本的“多种可能”,比如要匹配cat或是cut,在正则表达式看来&#

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值