COMMONSENSEQA: A Question Answering Challenge Targeting Commonsense Knowledge

最新推荐文章于 2024-06-16 09:40:41 发布

zsf2951186806

最新推荐文章于 2024-06-16 09:40:41 发布

阅读量1.5k

点赞数 2

分类专栏：论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zsf2951186806/article/details/89555128

版权

本文提出COMMONSENSEQA，一个旨在测试模型常识理解能力的问答数据集，通过CONCEPTNET构建，包含12,247个问题。尽管现有模型表现仍远低于人类，但该数据集为研究模型的常识学习提供了新途径。" 106616172,8584583,Welink H5轻应用开发流程详解,"['前端开发', 'Java', 'API接口', 'Welink平台']

摘要由CSDN通过智能技术生成

题目与摘要

本文针对什么任务？任务简要介绍下。

创建问答数据集，基于知识图谱

本文发现了什么问题？该文大体是怎么解决的？解决得如何？

以往的问答都是针对给定文字或者段落，提出问题，选择答案。回答问题所需的广泛知识背景（段落未给出）比较少。

基于CONCEPTNET创建了COMMONSESENSEQA数据集。在CONCEPTNET中抽取具有相同语义关系的source concept和target concept。以source为基础编写,target作为答案，编写单项选择题。希望workers可以利用到以前的知识。创建了12,247个问题。

acc baseline 56%，但是距离人类标准89%还有很大差距。

解释下题目。题目起得如何？能概括内容并吸引人吗？

题目简单明了，概括了整篇文章内容。

介绍

这个任务以往是如何解决的？作者沿着哪条路径继续研究的？为什么？

以往大部分是在给定文本中寻找问题答案，常识需求特别少。

SWAG给定事件的描述，推测后续的事件发展。但是在未标注的语料上就可以很好的训练，所以SWAG的水平已经达到人类。

VCR，看图回答问题：需要更广的常识。

目前工作存在什么问题？为什么？你觉得可能还存在什么其他问题？为什么？

目前的常识研究只触及表面。需要研究模型到底学习到了什么，以及还有什么缺陷。

常识的划分还不够细，CONCEPT与CONCEPT之间的relation对应到语言，还是有问题。一些语义规则是否能很好的融入到模型中，或者人类的语言规则与机器学习到的是否一致？

该文准备如何解决这个问题？为什么可以这样解决？你觉得该文解决这个问题的方法如何？为什么？你觉得可以如何/或更好的解决这个问题？为什么？

构建了一个基于CONCEPTNET的常识问答数据集，提出了完整的流程生成问题。

因为依据常识的生成问题中，选取一个source concept 以及3个具有相同语义关系的target concept。从中选取一个正确答案，并填加2个干扰项，并众包构建问题，筛选。

因为workers需要用到知识来构建问题以区分CONCEPT。

控制变量做的很好。因为这样构建的单选题的选项比较相似，难度也比较大，更易考验，模型是否能够区分。

我觉得应该使用大量的文本，让模型进行

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zsf2951186806 CSDN认证博客专家 CSDN认证企业博客

码龄8年

28: 原创

14万+: 周排名

170万+: 总排名

2万+: 访问

: 等级

635: 积分

9: 粉丝

16: 获赞

5: 评论

39: 收藏

私信

关注

热门文章

分类专栏

知识 1篇
强化学习 1篇
迁移学习 1篇
论文笔记 9篇
emotionx 1篇
坑 2篇
对话模型 1篇
情感 1篇
图 1篇
数据集 1篇

最新评论

brat配置
ibudhydgy: 您好请问用brat标注关系以后要用神经网络进行关系抽取 pipeline式的应该将.ann文件转换成什么格式呢
对话数据集
YirongChen: 欢迎关注最新的中文个性情感对话数据集： https://github.com/scutcyr/CPED 任务见： https://paperswithcode.com/dataset/cped
Deeper Insights into Graph Convolutional Networks for Semi-Supervised Learning
weixin_43332290: 你好，博主，cora数据集一共7个类别，没看懂论文中说的每个类别的标签是什么意思，这里标签和类别不是一个概念吗？
brat配置
zsf2951186806 回复 zhubib: 不好意思，我后来就没有再弄过了，但是是不是浏览器的问题，我当时用的好像是谷歌。但是后期使用还是放在服务器上好一点
brat配置
zhubib: brat按教程装在虚拟机上的，独立运行模式，终端显示服务器加载成功，但是在浏览器打开127.0.0.1/index.xhtml，怎么都无法进入欢迎界面。点击右上角brat图标，也没有反应。请博主支招，不胜感激？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。