需要两个文件
stanford-parser.jar
提取码:no9q
stanford-chinese-corenlp-2018-10-05-models.jar
提取码:qbpb
使用PCFG模型
import jieba, os
from nltk.parse import stanford
if __name__ == '__main__':
string = '今天天气真好!'
# HMM:隐马尔科夫模型
# 马尔科夫链:假设当前单词只和前一个单词有关,即二元模型
seg_list = jieba.cut(string, cut_all=False, HMM=True) # 使用HMM隐马尔科夫模型
seg_str = ' '.join(seg_list)
print(seg_str)
parser_path = 'stanford-parser.jar'
model_path = 'stanford-chinese-corenlp-2018-10-05-models.jar'
# 必须使用jdk1.8以上,如果环境变量中已有JAVA_HOME则将下面代码注释
# 指定JDK1.8路径 -- 通过代码的方式添加环境变量
# if not os.environ.get('JAVA_HOME