基于电影知识图谱的智能问答系统
文章平均质量分 87
appleyk
这个作者很懒,什么都没留下…
展开
-
基于电影知识图谱的智能问答系统(五) --Spark朴素贝叶斯分类器
一、Who is 贝叶斯 二、什么是贝叶斯分类器贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN和GBN由于涉及算法,比较抽象,想了解详情的请参考博文:分类算法之朴素贝叶斯分类(Naive Bayesian classification)如果上面你看完还是一时接受不了这个算法,那么,我就发挥一下,简明扼要形象的说一下我的理解假如辨别男人的特征是: 短头发,运动鞋,大鼻...原创 2018-05-17 11:57:00 · 37883 阅读 · 48 评论 -
基于电影知识图谱的智能问答系统(六) -- 问题训练样本集敲定
上一篇:基于电影知识图谱的智能问答系统(五) --Spark朴素贝叶斯分类器 在上一篇博文中,我们利用朴素贝叶斯分类器(Naive Bayes Model)简单玩了一个男女性别分类的demo,如果你细心的从头到尾跟了一遍demo并进行本机测试后,你会发现,其实分类器的工作原理很简单,总结一下,主要有五点:1、生成(或外部文件加载)训练集样本 【样本:LabelPoint类型,再细...原创 2018-05-21 10:00:26 · 32032 阅读 · 33 评论 -
基于电影知识图谱的智能问答系统(七) -- Neo4j语句那点事
上一篇:基于电影知识图谱的智能问答系统(六) -- 问题训练样本集敲定 到目前为止,本系列文章快接近尾声了,本篇是该系列文章的倒数第二篇,本来想打算直接跳过进入最后一章的,但是感觉有必要再讲一下neo4j,博主的文章中不止一次介绍过neo4j的使用,但感觉还是不够细致,所以,借助着这个系列文章,再来捋一下neo4j语句的用法,希望给用惯了传统关系型sql语句的兄弟们一个喜欢上Cyphe...原创 2018-05-22 10:44:07 · 29256 阅读 · 2 评论 -
基于电影知识图谱的智能问答系统(一) -- Mysql数据准备
一、MySql数据说明(1)数据库:movie(2)genre:电影类别表(3)movie:电影基本信息表(4)movie_to_genre:电影与类别的对应关系 【电影id == 类别id】(5)person:演员基本信息表(6)person_to_movie:演员与电影对应的关系【演员id == 电影id】二、MySql数据脚本语句(1)截图效果(2)CSDN积分下载链接地址:https://...原创 2018-05-16 08:54:12 · 49004 阅读 · 36 评论 -
基于电影知识图谱的智能问答系统(二) -- Neo4j导入CSV文件
基于上一篇:基于电影知识图谱的智能问答系统(一) -- Mysql数据准备 我们已经准备好了CSV数据文件,接下来,就是如何导入这些数据到Neo4j中了 一、Neo4j默认导入目录路径 比如我的neo4j安装根路径在D盘下,其默认的导入文件的入口文件夹是 如果没有,请自行创建这个文件夹 随后我们将我们从mysql导出的cs...原创 2018-05-16 10:02:16 · 51184 阅读 · 22 评论 -
基于电影知识图谱的智能问答系统(三) -- Spark环境搭建
由于该项目后期会涉及到spark的朴素贝叶斯分类器,而该分类器可以通过训练问题集合进行问题模板概率匹配,因此,系统中是否搭建了spark环境对项目是否能run起来至关重要。一、工具包及环境搭建简易说明由于工具包比较大,涉及scala语言安装包、hadoop安装包以及spark-hadoop安装包,故只提供百度网盘的下载链接下载地址:https://pan.baidu.com/s/10XUKpYBX...原创 2018-05-16 11:35:38 · 39386 阅读 · 23 评论 -
基于电影知识图谱的智能问答系统(四) --HanLP分词器
上一篇:一、什么是分词器? 分词器,是将用户输入的一段文本,分析成符合逻辑的一种工具。到目前为止呢,分词器没有办法做到完全的符合人们的要求。和我们有关的分词器有英文的和中文的分词器:输入文本-关键词切分-去停用词-形态还原-转为小写中文的分词器分为:单子分词 例:中国人 分成中,国,人二分法人词 例:中国人 分成中国,国人词典分词 例:中国人 分成中国,国人,中国人现在用的...原创 2018-05-16 13:10:51 · 42870 阅读 · 38 评论 -
基于电影知识图谱的智能问答系统(八) -- 终极完结篇
基于电影知识图谱的智能问答系统系列章节传送门:基于电影知识图谱的智能问答系统(一) -- Mysql数据准备基于电影知识图谱的智能问答系统(二) -- Neo4j导入CSV文件基于电影知识图谱的智能问答系统(三) -- Spark环境搭建基于电影知识图谱的智能问答系统(四) -- HanLP分词器基于电影知识图谱的智能问答系统(五) -- Spark朴素贝叶斯分类...原创 2018-05-23 16:34:11 · 69333 阅读 · 211 评论