这里介绍两个中文分词工具包:pullword和pkuseg。 1. pullword 它采用在线服务器运作传输输入和输出,python接口在这里,针对python3,还需要做一些简单的细节更改。 这还有一个简单的网页版demo,供在线测试。 如果在for 循环中大量反复调用这个包,由于跟在线服务器传输频繁,会有一些速度上的问题,甚至连接短暂被拒绝。这时候使用下面的本地分词工具就好了。 2. pkuseg 这是一个多领域中文分词工具包,按这里配置即可。