python库--flashtext--大规模数据清洗利器

 

flashtext.keyword (flashtext)
类/方法返回值参数说明
.KeywordProcessor()对象kpcase_sensitive=False是否区分大小写
添加关键词   
kp.add_keyword() keyword检索的词
clean_name=None显示或要被替换为的词(默认keywords本身)
kp.add_keywords_from_dict() keyword_dictkey: 类似于clean_name
value: 类似于[keyword]
kp.add_keywords_from_list() keyword_list类似于[keyword]
删除关键词   
kp.remove_keywords() keywoed要删除的keyword
kp.remove_..._from_dict() keyword_dict参考添加
kp.remove_..._from_list() keyword_list参考添加
设置单词边界   
kp.add_non_word_boundary() character添加非单词边界的字符, 比如添加'/', 那么此字符将不会被识别为单词边界
关键字提取   
kp.extract_keywords()list关键字提取
sentence要被检索的字符串, 匹配到则返回clean_name
span_info=False是否返回关键字位置信息
    
关键字替换   
kp.replace_keywords()str关键字替换
sentence要被替换的字符串, 把keywords替换为clean_name
    

转载于:https://www.cnblogs.com/P--K/p/8335066.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值