正则匹配多个关键词_flashtext 与正则表达式关键词查找性能对比

0c6d503f628831a41769b8f6eb4c3f53.png

1、多关键词查找

普通的场景下,想要从一个字符串中找到一个关键字,可以使用字符串的find方法

target = 'this is a book'
print(target.find('book'))

如果想要查找的关键词有多个,仍然可以使用find方法,它并没有你想象中那么慢,但如果关键词的数量继续上升,你就应该使用正则表达式来处理,不论是性能还是程序的编写难度都优于使用find方法

import re
target = '但如果关键词的数量继续上升,你就应该使用正则表达式来处理,不论是性能还是程序的编写难度都优于使用find方法'
pattern = re.compile("(关键词|正则表达式|性能)")
res = pattern.findall(target)
print(res)

当关键词的数量继续上升,达到数万个甚至更多时,正则表达式的性能也会开始变得难以接受,对于正则表达式,我们要明白一点,我们用它表达一个字符串模式时,它的确是万能的,没有正则搞不定的模式,但是这个模式在匹配时,性能层面上

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值