Python List 高性能模糊搜索,模糊搜索优化
在python里,针对list进行模糊搜索,一个简单的方案就是用str自带的find方法:
a = ['哈哈', '呵呵', '啦啦', '嘻嘻', '乐乐', '快快乐乐', '乐乐高']
[a[i] for i,x in enumerate(a) if x.find('乐乐')!=-1]
此种方法能满足基本的使用场景,但当list非常大时,因为此种方法需要遍历每个元素,运行速度会非常的慢。
这时,我们可以使用python里自带的difflib
库,运行速度快到飞起:
import difflib
a = ['哈哈', '呵呵', '啦啦', '嘻嘻', '乐乐', '快快乐乐', '乐乐高']
res = difflib.get_close_matches('乐乐', a, 3, cutoff=0.6)
get_close_matches
参数解释:
第一个参数:搜索的关键词,
第二个参数:待搜索的List,
第三个参数:搜索出来结果的个数
第四个参数(cutoff): 匹配度,模糊搜索一般调0.6就可以了,越大越精确