基于电影知识图谱的智能问答系统(八) -- 终极完结篇

!!!!!!!!!!!!! !!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

!!!!!!!!!!!!! !!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!


基于电影知识图谱的智能问答系统系列章节传送门:

基于电影知识图谱的智能问答系统(一) -- Mysql数据准备

基于电影知识图谱的智能问答系统(二) -- Neo4j导入CSV文件

基于电影知识图谱的智能问答系统(三) -- Spark环境搭建

基于电影知识图谱的智能问答系统(四) -- HanLP分词器

基于电影知识图谱的智能问答系统(五) -- Spark朴素贝叶斯分类器

基于电影知识图谱的智能问答系统(六) -- 问题训练样本集敲定

基于电影知识图谱的智能问答系统(七) -- Neo4j语句那点事

番外篇(2022年11月15日16:45:35)

=========================================================================

如果docker官方的镜像中心无法访问(国外的需要墙)下载不了image,可以参考以下的操作来解决:

1、找到“daemon.json”文件;

2、使用vim命令将其打开;

3、添加“{ "registry-mirrors" :["https://docker.mirrors.ustc.edu.cn"]}”内容;

4、重启docker即可。

=========================================================================

定制了2个docker镜像,分别是带数据的neo4j数据库镜像和带hanlp字典数据及训练样本数据和应用程序的tomcat镜像,如下

镜像地址:Docker Hubhttps://hub.docker.com/r/appleyk/neo4j-movies


镜像地址:Docker Hubhttps://hub.docker.com/r/appleyk/tomcat8-movies


其中tomcat镜像由于带有hanlp数据部分,所以镜像本身有点大,如果你的docker没有配置镜像加速代理服务的话拉取会很慢,所以在我的阿里云镜像仓库中也推送了一份如下:

阿里云镜像地址:registry.cn-hangzhou.aliyuncs.com/appleyk/tomcat8-movies

拉取方式:

docker pull registry.cn-hangzhou.aliyuncs.com/appleyk/tomcat8-movies:v1.0

使用docker启动neo4j容器效果如下(无需考虑版本和数据导入,只需按配置来即可):


使用docker启动tomcat容器效果如下(无需考虑hanlp数据和训练样本,只需按配置来即可):


GitHub地址:GitHub - kobeyk/Spring-Boot-Neo4j-Movies: SpringBoot集成Neo4j图数据库,利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统。

码云(gitee)地址:Spring-Boot-Neo4j-Movies: SpringBoot集成Neo4j图数据库,利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统。

注意最新代码为分支:v0.1.2

注:本篇不再过多的讲解如何demo实现了,集成也很是简单的,前面几章也已经给本篇做足了铺垫。项目中的代码注释也是非常的详细,最后会附上整个项目的git仓库地址。

一、效果预览

(1)电影简介

前端展示:

后台效果:

(2)电影评分

前端展示:

后台效果:

(3)电影演员列表

前端展示:

后台效果:

(4)演员A和演员B合作过哪些电影

前端展示:

后端效果:

由于章子怡本来是一个完整的人名,但是HanLP分词的时候,却意外的“失手”了,因此导致最后查询无果

我们再换个问题试验一把

后台效果:

(5)某演员出演过那种类型的电影或演过某种类型的电影有哪些

......etc,其余不在做演示,下面直接来看如何利用Spring-Boot搭建我们的智能问答系统

二、项目目录结构图

三、Movie节点类

这里只拿电影信息的节点类来进行演示,比如,movie对应的节点在Java中定义类如下:

package com.appleyk.node;

import java.util.List;

import org.neo4j.ogm.annotation.NodeEntity;
import org.neo4j.ogm.annotation.Relationship;

import com.fasterxml.jackson.annotation.JsonProperty;

@NodeEntity
public class Movie extends BaseEntity{

	private Long mid;
	private Double rating;
	private String releasedate;
	private String title;
	private String introduction;

	@Relationship(type = "is")
	@JsonProperty("电影类型")
	private List<Genre> genres;
	

	public Movie() {

	}

	public Long getMid() {
		return mid;
	}

	public void setMid(Long mid) {
		this.mid = mid;
	}

	public Double getRating() {
		return rating;
	}

	public void setRating(Double rating) {
		this.rating = rating;
	}

	public String getReleasedate() {
		return releasedate;
	}

	public void setReleasedate(String releasedate) {
		this.releasedate = releasedate;
	}

	public String getTitle() {
		return title;
	}

	public void setTitle(String title) {
		this.title = title;
	}

	public String getIntroduction() {
		return introduction;
	}

	public void setIntroduction(String introduction) {
		this.introduction = introduction;
	}

	public List<Genre> getGenres() {
		return genres;
	}

	public void setGenres(List<Genre> genres) {
		this.genres = genres;
	}

}

其中属性和neo4j中的movie节点的属性一一对应

电影信息节点里面带有关系is,对应neo4j中该电影的类型

通过Controller对外提供的查询接口如下:

外部调用效果如下:

四、加载自定义带词性的字典数据

注:不要使用HanLP提供的自定义词典路径,因为这个除了不能随心所欲的定义分词的词性以外,还极容易出现分词紊乱,词性对不上的bug,为了满足我们对专有电影名、电影分数及电影类型词性的定义,我们使用额外加载的方式设置HanLP的自定义分词,application.properties中设置自定义词典的路径如下:

这三个文件的下载地址:自定义词典.zip_免费高速下载|百度网盘-分享无限制

注:也可以根据自己的需求进行设置

五、项目完整地址

GitHub下载地址:Spring-Boot集成Neo4j并利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统

完结!!!

番外篇:如何将项目导入到IDEA并运行测试效果?

(1)IDEA项目结构图(导入pom文件,配置好Maven后如下)

(2)项目配置文件

(3)内嵌html测试前端访问页面

(4)启动项目

(5)浏览器访问主页Index.html

  • 121
    点赞
  • 599
    收藏
    觉得还不错? 一键收藏
  • 213
    评论
好的,您的问题是关于基于医疗知识图谱的问答系统。那么,我可以为您提供一些相关的信息和思路。 首先,一个基于医疗知识图谱的问答系统,需要具备以下几个方面的能力: 1. 知识图谱构建:需要从多个数据源中汇总和整合医疗相关的数据,构建出医疗领域的知识图谱。 2. 自然语言处理:需要利用自然语言处理技术将用户的自然语言输入转化为计算机可理解的形式。 3. 问题建模:需要将用户的问题建模为医疗知识图谱中的查询语句,以便与知识图谱中的相关实体进行匹配。 4. 答案生成:需要利用知识图谱中的实体和关系,生成符合用户问题的答案。 基于以上几点,一个基于医疗知识图谱的问答系统的实现思路如下: 1. 数据收集和整合:从多个数据源中获取医疗相关的数据,包括病例、疾病、药品、医学知识等。通过对这些数据进行清洗和整合,构建出医疗领域的知识图谱。 2. 自然语言处理:利用自然语言处理技术,将用户的自然语言输入转化为计算机可理解的形式,包括分词、词性标注、命名实体识别等。 3. 问题建模:将用户的问题进行分析,提取出问题中的关键词和实体信息,构建出医疗知识图谱中的查询语句。 4. 查询匹配:将用户的查询语句与知识图谱中的实体和关系进行匹配,找到与查询语句相关的实体和关系。 5. 答案生成:利用找到的实体和关系,生成符合用户问题的答案。同时,还可以利用自然语言生成技术,将生成的答案进行自然语言化处理,以提高用户体验。 以上就是基于医疗知识图谱的问答系统的实现思路。当然,具体实现还需要考虑更多的细节和技术细节。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 213
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值