医药领域知识图谱快速及医药问答项目--项目探究

最新推荐文章于 2024-05-15 21:27:06 发布

只想安静的一个人

最新推荐文章于 2024-05-15 21:27:06 发布

阅读量3.7k

点赞数 3

分类专栏： NLP聊天机器人实战文章标签：知识图谱问答机器人

本文链接：https://blog.csdn.net/u014258362/article/details/90519360

版权

1 篇文章 0 订阅

订阅专栏

开篇

文章根据@liuhuanyong_iscas大佬的项目进行调试与解析，作为KGQA和NLP入门的一个学习实战的项目。有不对的地方请不吝指教，若有侵犯相关权益，也请给我留言，我会撤下该文章。
项目原地址：https://github.com/liuhuanyong/QASystemOnMedicalKG
CSDN链接：https://blog.csdn.net/lhy2014/article/details/82953792

环境的搭建比较简单，这里就不做展开了，主要对项目各部分的功能进行探究，弄清整个系统的流程。

在这里插入代码片这部分主要是通过python将获取到的语料构建成知识图谱，使用py2neo将每个node创建好，并创建相应的relationship，使节点之间相互关联。
对应的是项目中 build_medicalgraph.py 这个脚本，类名为MedicalGraph

下面对各个方法进行讲解：

create_graphnodes（创建节点）
调用create_node方法，创建Drugs,Foods,Checks,Departments,Symptoms，Disease这些节点

这个脚本的功能主要是进行问题类型的分类，对应的脚本为question_classifiler.py

读取并加载特征词
将所有的特征词构建领域的actree
调用build_actree：将所有的特征词汇构建成actree为后续的问句特征词的提取提供使用
使用特征词构建词典得到词的类型
调用bulild_wdtype_dict：所有的特征词进行类型标记包含的类型有（disease、department、check、drug、food、symptom、producer）
问题类型匹配通过这里的特征词典得到问题的类型属于哪一类
疑问句问词词典的构建

question_parser.py通过分类脚本得到的结果，得到neo4j的query语句.

最终返回sqls，生成对应的查询语句在这里插入图片描述

answer_search.py 在neo4j中获取内容，匹配模板得到回复

结果展示
在这里插入图片描述

关于这个项目的流程解析就写到这里。不是很复杂的项目，作为知识图谱的练手项目还是挺好的。
再次感谢原创作者的分享。

关注