KBQA 常用的问答数据集之 QALD

 QALD* 系列数据集下载

QALD* 系列数据集相关信息

1.  数据集概述

       QALD是一系列关于在关联数据上回答问题的评估活动, 其使用的知识库是DBpedia。QALD是一个开放的挑战,它针对的是在用户(用自然语言表达他或她的信息需求)和结构化(特别是RDF)数据之间进行交互(mediate)的所有系统。我们的目标是得到一个最先进的系统的优点和缺点,以及了解如何开发方法处理数据量巨大的RDF数据,这些数据分布在不同的数据集,并且是异构的,有噪音的,有时甚至不一致。

        任务

       参与者的一般任务如下:给定一个或几个RDF数据集和自然语言问题,返回正确的答案或检索这些答案的SPARQL查询。

2. 模型性能比较

各模型在数据集QALD-9上的表现
模型(年份)F1论文代码链接
NSQA(2020)45.33Question Answering over Knowledge Bases by Leveraging Semantic Parsing and Neuro-Symbolic Reasoning

各模型在数据集QALD-7上的表现
模型(年份)F1论文代码链接
rank query graph(2019)0.28Learning to Rank Query Graphs for Complex Question Answering over Knowledge GraphsGitHub - AskNowQA/KrantikariQA: An InformationGain based Question Answering over knowledge Graph system.

各模型在数据集QALD-6上的表现
模型(年份)F1论文代码链接
STF(2018)0.8A State-transition Framework to Answer Complex Questions over Knowledge Base
NFF(2018)0.78Answering Natural Language Questions by Subgraph Matching over Knowledge Graphs

https://github.com/pkumod/gAnswer

各模型在数据集QALD-5上的表现
模型(年份)F1论文代码链接
SubQG(2019)0.624Leveraging Frequent Query Substructures to Generate Formal Queries for Complex Question Answeringhttp://ws.nju.edu.cn/SubQG/

后续将持续更新,欢迎大家评论补充~

构建医疗领域知识图谱KBQA(Knowledge-Based Question Answering)问答系统需要经过以下步骤: 1. 数据收集和预处理:从医疗文献、医院数据库、医生的专业知识等多个渠道搜集医疗领域的数据,并进行数据清洗和预处理,确保数据的质量和一致性。 2. 实体识别和关系抽取:利用自然语言处理NLP)技术,对预处理后的数据进行实体识别和关系抽取。通过算法和模型来识别医疗领域中的实体,如疾病、药物、症状等,并提取实体之间的关系。 3. 构建知识图谱:将实体和关系整理成图谱的形式,以三元组的形式存储在数据库中。图谱以实体节点和关系边连接,形成一个具有结构化的医疗知识库。 4. 问答模块设计:设计一个能够接收自然语言问题的问答模块。该模块需要将自然语言问题转化为图谱查询的形式,选择合适的查询算法和模型,从知识图谱中检索出相关信息。 5. 答案生成和评估:利用检索到的相关信息,生成答案并返回给用户。评估答案的准确性和可靠性,可以借助医疗专家的验证和人工智能技术进行自动评估。 总之,构建医疗领域知识图谱KBQA问答系统需要进行数据收集和预处理、实体识别和关系抽取、知识图谱构建、问答模块设计以及答案生成和评估等关键步骤。通过这样的系统,可以提供精准、高效的医疗问题解答服务,帮助医疗工作者和病患更好地获取医疗知识和服务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值