用jieba进行分词时,人名总是切分不出来,比如‘袁今夏’可能会被分成 袁、今夏 或者是袁今、夏,所以我需要提供一个人名表(roles_name.txt),用jieba依据这个表来分词,这样的话“袁今夏”会当成一个整体被分出来
jieba.load_userdict('../roles_name.txt')
default_mode = jieba.lcut(file, cut_all=False) # 精确模式
roles_name.txt 截取了部分
用jieba进行分词时,人名总是切分不出来,比如‘袁今夏’可能会被分成 袁、今夏 或者是袁今、夏,所以我需要提供一个人名表(roles_name.txt),用jieba依据这个表来分词,这样的话“袁今夏”会当成一个整体被分出来
jieba.load_userdict('../roles_name.txt')
default_mode = jieba.lcut(file, cut_all=False) # 精确模式
roles_name.txt 截取了部分