农业知识图谱搭建和遇到的问题

本文详细介绍了基于华东师范大学数据科学与工程学院的农业知识图谱构建过程,包括使用Scrapy爬虫框架抓取数据,Neo4j作为图形数据库存储知识,以及在Windows环境下遇到的安装和配置问题。此外,还提到了Django启动和解决HTTP_HOST问题的步骤。
摘要由CSDN通过智能技术生成

Agriculture_KnowledgeGraph

demo:http://ecnukg.vicp.io
github:https://github.com/qq547276542/Agriculture_KnowledgeGraph

本文基于华东师范大学数据科学与工程学院构建的面向智慧农业的知识图谱及其应用系统,讲述了农业知识图谱搭建的过程和遇到的问题。

1.流程图

在这里插入图片描述

2.详细介绍

爬虫框架
程序中使用scrapy作为爬虫的框架,在scrapy中使用Item对象来保存爬取到的数据,只需将要保存的字段声明到Item类里;Spiders类定义了如何爬取某个网站;当Item在Spider中被收集之后,它将会被传递到Item Pipeline,在Pipeline中可以将爬取到的结果保存到数据库中。

数据获取
数据获取主要分为两部分内容,一部分是实体之间的关系,另一部分是实体的数据。实体存储在predict_lables.txt中,是由KNN算法预测的13W多个实体。实体之间的关系一部分在wikidata上爬取获得,另一部分通过互动百科页面中得到;实体的数

  • 6
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值