CivilAviation Q&A
根据民航业年度公报(年报)构建民航业知识图谱并实现语义查询。
项目地址:https://github.com/ShawnHXH/QA-CivilAviationKG
平台
- Windows 10 x64
- Python 3.7
- Neo4j community 3.5.20
运行
-
确保安装所需依赖
pip install -r requirements.txt注:
python-Levenshtein如果安装不成功,则可以下载对其进行离线安装。 -
构建知识图谱
修改
const.py文件中连接数据库使用的URI,USERNAME和PASSWORD的值。然后执行:python build_cakg.py运行大约需要2~5分钟。
-
可以使用两种方式运行:
- 运行命令行端
普通问题的回答以字符串的形式给出;带有图表的回答,图表会被渲染至python run_cmd.pyresults文件夹中。 - 运行web端(效果图见下文)
带有图表的回答和普通回答一样会被渲染至web页面中,同时也被保存至本地python run_web.pyresults文件夹中。
注1:最好使用谷歌浏览器(Google Chrome);
注2:生成图表的文件夹地址可以在const.py中更改CHART_RENDER_DIR。
- 运行命令行端
-
have fun!
简介
一. 项目结构
--------------------------------------- root
|------data/ # 数据存放
|------dicts/ # 存放特征词(运行build_cakg.py后自动生成)
|------question/ # 存放问句中的疑问词
|------reference/ # 存放指代词
|------tail/ # 存放尾词(后缀词)
|------data.json # 从年报中组织出的数据
|------raw.7z # 11-19年的年报
|------demo/ # 以jupyter-notebook的形式给出了各种问题类型的演示和说明
|------doc/ # 存放有关readme的文件
|------lib/ # 函数库
|------results/ # 存放某些问题生成的图表(会自动生成)
|------test/ # 存放一些单元测试
|------web/ # web app
......
|------answer_search.py # 回答组织器
|------build_cakg.py # 构建知识图谱
|------chatbot.py

最低0.47元/天 解锁文章
2992

被折叠的 条评论
为什么被折叠?



