一开始用下面的代码去匹配类似"华为将与高通在通信领域建立合作"的句子,e1和e2是用nlp工具提取出来的组织或机构名,后来发现存在否定前缀的反例,“没有与…合作”于是增加反例的排除条件,即op_result的匹配。但是返回结果出错,匹配到的都是正例。
错误示例:
result = re.search(e1+'(.*?)[和与跟(协同)](.*?)'+e2+'(.*?)合作', sentence)
op_result = re.search(e1+'(.*?)[(没有与)(没有和)(没有跟)](.*?)'+e2+'(.*?)合作', sentence)
后来找到了“或”的写法,正确代码如下:
result = re.search(e1+'(.*?)(与|和|跟|协同)(.*?)'+e2+'(.*?)合作', sentence)
op_result = re.search(r''+e1 + '(.*?)(没有与|没有和|没有跟)(.*?)' + e2 + '(.*?)合作', sentence)
还有一个坑是在表达式前加r,因为有了变量,所以不能直接加r,要写成r’’+e1这种形式,注意此处是两个单引号
https://www.itdaan.com/blog/2010/11/03/7d81b73342a1bc80ce9f4ddce3e03264.html
或
“或”是正则表达式灵活性的重要体现,我们可以规定某个位置的文本的“多种可能”,比如要匹配cat或是cut,在正则表达式看来&#