- jieba.cut(s)精确模式,返回一个可迭代的数据类型
- jieba.cut(s,cut_all=True)全模式,输出文本s中所有可能的词组
- jieba.cut_for_search(s)搜索引擎模式,适合搜索引擎建立索引的分词结果
- “分隔符”.join(word)将word中的词用分隔符分隔
import jieba
str="中华人民共和国万岁"
print(" ".join(jieba.cut(str))) #分隔符为空格
print(" ".join(jieba.cut(str,cut_all=True)))
print(" ".join(jieba.cut_for_search(str)))
5. jieba.lcut(s)精确模式,返回一个列表类型,建议使用
6. jieba.lcut(s,cut_all=True)全模式,返回一个列表类型,建议使用
7. jieba.lcut_for_search(s)搜索引擎模式,返回一个列表类型,建议使用
import jieba
str="中华人民共和国万岁"
print(jieba.lcut(str))
print(jieba.lcut(str,cut_all=True))
print(jieba.lcut_for_search(str))
- jieba.add_word(w)向分词词典中增加新词w
import jieba
str="我们一起盘他"
jieba.add_word("盘他")
#不填加“盘他”,就会将“盘他”分为“盘”“他”两部分输出
print(jieba.lcut(str))