构建民航业知识图谱并实现语义查询

CivilAviation Q&A

根据民航业年度公报(年报)构建民航业知识图谱并实现语义查询。
项目地址:https://github.com/ShawnHXH/QA-CivilAviationKG

平台

  • Windows 10 x64
  • Python 3.7
  • Neo4j community 3.5.20

运行

  1. 确保安装所需依赖

      pip install -r requirements.txt
    

    注:python-Levenshtein 如果安装不成功,则可以下载对其进行离线安装。

  2. 构建知识图谱

    修改const.py文件中连接数据库使用的URIUSERNAMEPASSWORD的值。然后执行:

      python build_cakg.py
    

    运行大约需要2~5分钟。

  3. 可以使用两种方式运行:

    1. 运行命令行端
        python run_cmd.py
      
      普通问题的回答以字符串的形式给出;带有图表的回答,图表会被渲染至results文件夹中。
    2. 运行web端(效果图见下文)
        python run_web.py
      
      带有图表的回答和普通回答一样会被渲染至web页面中,同时也被保存至本地results文件夹中。
      注1:最好使用谷歌浏览器(Google Chrome);
      注2:生成图表的文件夹地址可以在const.py中更改CHART_RENDER_DIR
  4. have fun!

简介

一. 项目结构

---------------------------------------  root
   |------data/                        # 数据存放
          |------dicts/                # 存放特征词(运行build_cakg.py后自动生成)
          |------question/             # 存放问句中的疑问词
          |------reference/            # 存放指代词
          |------tail/                 # 存放尾词(后缀词)
          |------data.json             # 从年报中组织出的数据
          |------raw.7z                # 11-19年的年报
   |------demo/                        # 以jupyter-notebook的形式给出了各种问题类型的演示和说明
   |------doc/                         # 存放有关readme的文件
   |------lib/                         # 函数库
   |------results/                     # 存放某些问题生成的图表(会自动生成)
   |------test/                        # 存放一些单元测试
   |------web/                         # web app
   ......
   |------answer_search.py             # 回答组织器
   |------build_cakg.py                # 构建知识图谱
   |------chatbot.py                   
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值