本步的思路是运用命名实体识别工具来提取小说中的人名
我用的工具是stanfordcorenlp,当然还有其他的工具可以选择,如snownlp,THULAC等,我将提取的人名保存在txt文件中,经过人工去错后,得到如下人名:
提取人名的代码如下
#写入txt文件
from stanfordcorenlp import StanfordCoreNLP
nlp = StanfordCoreNLP(r'D:\java\stanford-corenlp-4.2.2', lang='zh')
with open(