文章大纲 0.内容梗概 1. 基于传统统计算法的分词组件 1.1 hanlp : Han Language Processing 1.1.1 pyhanlp 安装 1.1.2 功能及分词样例 1.1.3 分词原理 1.1.4 特点、性能、准确率 1.2 语言技术平台(Language Technology Platform,LTP) 1.2.1 LTP 安装 1.2.2 功能及分词样例 1.2.3 分词原理 1.2.4 特点、性能、准确率 1.3 汉语分词系统ICTCLAS 1.3.1 安装 1.3.2 功能及分词样例 1.3.3 分词原理 1.3.4 特点、性能、准确率 1.4 thulac 一个高效的中文词法分析工具包 1.4.1 安装 1.4.2 功能及分词样例 1.4.3 分词原理 1.4.4 特点、性能、准确率 1.5 pkuseg多领域中文分词工具 1.5.1 安装 1.5.2 功能及分词样例 1.5.3 分词原理 1.5.4 特点、性能、准确率 1.6 其他知名开源分词组件 1.6.1 SnowNLP 1.6.2 结巴 参考文献 0.内容梗概 《自然语言处理实战入门》第三章 内容目录 中文分词原理及相关组件简介 之 ---- 汉语语言学 中文分词原理及相关组件简介 之 ---- 分词领域主要分词算法、组件、服务(上) 中文分词原理及相关组件简介 之 ---- 分词领域主要分词算法、组件、服务(中) 中文分词原理及相关组件简介 之 ---- 分词领域主要分词算法、组件、服务(下) 中文分词原理及相关组件简介 之 ---- 分词效果评测最佳实践 <