![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python自然语言处理
自然语言处理实战,核心技术和算法
XD1998
但行好事 莫问前程
展开
-
【Python自然语言处理】中文分词技术——统计分词
中文分词方法本文参考自书籍《Python自然语言处理实战:核心技术与算法》用做个人的学习笔记和分享1. 规则分词规则分词的详细笔记2. 统计分词3. 混合分词...原创 2020-03-09 12:03:04 · 2982 阅读 · 0 评论 -
【Python自然语言处理】中文分词技术——规则分词
中文分词方法本文参考自书籍《Python自然语言处理实战:核心技术与算法》用做个人的学习笔记和分享1. 规则分词规则分词是一种机械分词方法,主要通过维护词典,在切分语句时将语句的每个字符串和词表中的词逐一匹配找到则切分,找不到则不切分。具体包括:正向最大匹配法、逆向最大匹配法和双向最大匹配法1.1 正向最大匹配法1.1.1 算法描述①从左向右取待切分汉语句的m 个字符作为匹配字段...原创 2020-03-02 12:30:25 · 972 阅读 · 0 评论