![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
福尔摩斯之无以伦比
这个作者很懒,什么都没留下…
展开
-
python--jieba分词、词性标注、关键词提取、添加自定义词典完整代码示例
jieba是目前最好的 Python 中文分词组件,它主要有以下 3 种特性:支持 3 种分词模式:精确模式、全模式、搜索引擎模式支持繁体分词支持自定义词典1 分词 可使用 jieba.cut 和 jieba.cut_for_search 方法进行分词,两者所返回的结构都是一个可迭代的 generator,可使用 for 循环来获得分词后得到的每一个词语(unicode),或者直接使用 jieba.lcut 以及 jieba.lcut_for_search 直接返回 list。其中:ji.转载 2020-07-02 10:36:30 · 3582 阅读 · 1 评论 -
Hanlp词性表
HanLP词性标注集1 Area 形容词ad 副形词ag 形容词性语素al 形容词性惯用语an 名形词b 区别词beginbg 区别语素bl 区别词性惯用语c 连词cc 并列连词d 副词dg 辄,俱,复之类的副词dl 连语e 叹词end 仅用于终##终f 方位词g 学术词汇gb 生物相关词汇gbc 生物类别gc 化学相关词汇gg ...转载 2020-07-02 10:33:34 · 2219 阅读 · 0 评论