jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
- cut
cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词
- lcut
lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()
- prosseg的方法
posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析
s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s) # <generator object cut at 0x10a6e5500>
list(jieba.cut(s)