KBQA 常用的问答数据集之WebQuestions

目录

1. 论文相关

2. 数据集概述

2.1 内容介绍

2.2 数据统计

3. 模型性能比较


1. 论文相关

WebQuestions [Berant et al., 2013]

源自论文:Semantic Parsing on Freebase from Question-Answer Pairs

数据集:The Stanford Natural Language Processing Group

leaderboard: CodaLab Worksheets

2. 数据集概述

   2.1 内容介绍

    这个数据集经常用于semantic parsing 和question answering;其使用的知识库是Freebase

    每个examples 有三个fields:

    utterance: 自然语言问句。

    targetValue: 答案。

    url:AMT工作者可以从Freebase 页找到答案。

   2.2 数据统计

    数据集规模虽然较FREE917提高了不少,但有两个突出的缺陷:没有提供对应的查询,不利于基于逻辑表达式模型的训练;另外webquestions中简单问句多而复杂问句少。

WebQuestions数据集划分
total5,810
train3,778
test2,032

3. 模型性能比较

各模型在数据集WebQuestions上的表现
模型(年份)precRecAccF1论文代码链接

GraphParser

(2014)

41.937.039.3Large-scale Semantic Parsing without Question-Answer PairsDownloads | Siva Reddy

STAGG

(2015)

52.860.752.5Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base

https://github.com/scottyih/STAGG

Aqqu

(2015)

49.4More Accurate Question Answering on Freebase

QAoverFB

(2016)

53.3Question Answering on Freebase via Relation Extraction and Textual Evidence

GitHub - syxu828/QuestionAnsweringOverFB

MulCG

(2016)

52.43Constraint-Based Question Answering with Knowledge Graph

QUINT

(2017)

51.0Automated Template Generation for Question Answering over Knowledge Graphs

CompQA

(2018)

52.7Knowledge Base Question Answering via Encoding of Complex Query Graphs

APVA-TURBO

(2018)

63.4The APVA-TURBO Approach To Question Answering in Knowledge Base

ABWIM

(2018)

85.32An Attention-Based Word-Level Interaction Model: Relation Detection for Knowledge Base Question Answering
STF(2018)53.6A State-transition Framework to Answer Complex Questions over Knowledge Base
NFF(2018)49.6Answering Natural Language Questions by Subgraph Matching over Knowledge Graphs

https://github.com/pkumod/gAnswer

Tree2Seq

(2019)

52.1Knowledge-based question answering by tree-to-sequence learning

BAMnet

(2019)

55.7Bidirectional Attentive Memory Networks for Question Answering over Knowledge BasesGitHub - hugochan/BAMnet: Code & data accompanying the NAACL 2019 paper "Bidirectional Attentive Memory Networks for Question Answering over Knowledge Bases"
DAC(2020)54.8Hierarchical Query Graph Generation for Complex Question Answering over Knowledge Graph
AQG(2020)53.4Formal Query Building with Query Structure Prediction for Complex Question Answering over Knowledge Basehttps://github.com/Bahuia/AQGNet

后续将持续更新,欢迎大家评论和补充~

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
构建医疗领域知识图谱KBQA(Knowledge-Based Question Answering)问答系统需要经过以下步骤: 1. 数据收集和预处理:从医疗文献、医院数据库、医生的专业知识等多个渠道搜集医疗领域的数据,并进行数据清洗和预处理,确保数据的质量和一致性。 2. 实体识别和关系抽取:利用自然语言处理(NLP)技术,对预处理后的数据进行实体识别和关系抽取。通过算法和模型来识别医疗领域中的实体,如疾病、药物、症状等,并提取实体之间的关系。 3. 构建知识图谱:将实体和关系整理成图谱的形式,以三元组的形式存储在数据库中。图谱以实体节点和关系边连接,形成一个具有结构化的医疗知识库。 4. 问答模块设计:设计一个能够接收自然语言问题的问答模块。该模块需要将自然语言问题转化为图谱查询的形式,选择合适的查询算法和模型,从知识图谱中检索出相关信息。 5. 答案生成和评估:利用检索到的相关信息,生成答案并返回给用户。评估答案的准确性和可靠性,可以借助医疗专家的验证和人工智能技术进行自动评估。 总之,构建医疗领域知识图谱KBQA问答系统需要进行数据收集和预处理、实体识别和关系抽取、知识图谱构建、问答模块设计以及答案生成和评估等关键步骤。通过这样的系统,可以提供精准、高效的医疗问题解答服务,帮助医疗工作者和病患更好地获取医疗知识和服务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值