机器学习——数据清洗
模糊查询与替换
- fuzzywuzzy.fuzz
- 返回匹配相似度
- fuzz.ratio
- fuzz.partial_ratio
- fuzz.token_sort_ratio
- fuzz.token_set_ratio
from fuzzywuzzy import fuzz
# 简单匹配
fuzz.ratio("I love python", "I love python!")
# 输出结果
96
# 非完全匹配
fuzz.partial_ratio("I love python", "I love python!")
# 输出结果
100
# 忽略顺序匹配
fuzz.token_sort_ratio("I love python", "python I love")
# 输出结果
100
# 去重子集匹配
fuzz.token_set_ratio(