Python文本分析-常用中文停用词表(Chinese Stop Words)

在做jieba中文分词处理,进行文本分析,必不可少的停用词处理,国内比较常用的中文停用词库,有以下几个:

  • 中文停用词表
  • 哈工大停用词表
  • 百度停用词表
  • 四川大学机器智能实验室停用词库

而@elephantnose 对以上4个词库进行了合并去重,共计2311个,可在github直接下载使用~~

链接:GitHub链接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值