在做jieba中文分词处理,进行文本分析,必不可少的停用词处理,国内比较常用的中文停用词库,有以下几个:
- 中文停用词表
- 哈工大停用词表
- 百度停用词表
- 四川大学机器智能实验室停用词库
而@elephantnose 对以上4个词库进行了合并去重,共计2311个,可在github直接下载使用~~
链接:GitHub链接
在做jieba中文分词处理,进行文本分析,必不可少的停用词处理,国内比较常用的中文停用词库,有以下几个:
而@elephantnose 对以上4个词库进行了合并去重,共计2311个,可在github直接下载使用~~
链接:GitHub链接