之前在做python的词云作业时,希望保留一些特定的词汇,但在网上没有找到方法,今天在上python课的时候老师给出了解答:
首先,调用jieba.load_userdict(文件名),加载需要保留的词汇,文件内容是需要保留的词汇,然后使用jieba.lcut(text)即可对给定的文本进行分析,即可得到结果。
代码:
def cut_by_custom_dict(text=None):
jieba.load_userdict('../data/user_dict.txt')
return jieba.lcut(text)