mysql实现知识图谱_基于电影知识图谱的智能问答系统学习记录

本文记录了如何使用MySQL构建电影知识图谱,包括数据爬取、清洗、转化为RDF,以及通过本体构建和D2RQ工具进行数据转换。此外,还介绍了基于知识图谱的智能问答系统,涉及问句理解、实体识别、属性链接和答案推理的实现方法。
摘要由CSDN通过智能技术生成
学习了“谓之小一”大佬的 基于电影知识图谱的智能问答系统 ,做个记录。地址如下:https://github.com/weizhixiaoyi/DouBan-KGQA

一、知识图谱构建

  1. 爬取电影信息数据(json形式)

  2. 将爬取的数据转换为RDF格式

    2.1、数据清洗 

    将关键信息缺失的数据删除,去掉数据中的特殊符号等。

  2.2、json2mysql

    将爬取的json数据存储到MYSQL数据库中,根据需要建立主外键关联关系。

  2.3、RDB2RDF

    将RDB(关系数据库中的数据,此处为mysql)数据转为为RDF数据。

    2.3.1、本体构建:Protégé

    本体层构建,进行类和属性(对象属性和数据属性)的构建,保存为Turtle形式,命名为**.owl。

    2.3.2、数据格式转换:D2RQ工具

    D2RQ可以根据已定义的数据库自动生成预定义的mapping文件,然后用户可以在mapping文件上修改,把数据映射到自己的本体上。

6768db09a80a2d345e3533f1fdd80538.png

  3、目前常用的三元组存储方式有Neo4j图数据库,和jean。这次采用Apache Jena

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值