运行text.py,得到自动生成的graph.html文件。 分析 本项目采用了高频词,关键词,命名实体识别,主谓宾短语识别等抽取方式,并尝试将三类信息进行图谱组织表示,这种表示方式是一种尝试。 主要的信息处理分为以下几个步骤: 1)对文章进行处理,处理内容包括去噪、长句切分、短句切分