杂七杂八数据集

最新推荐文章于 2024-05-07 20:21:05 发布

zsf2951186806

最新推荐文章于 2024-05-07 20:21:05 发布

阅读量1.7k

点赞数 3

分类专栏：数据集

本文链接：https://blog.csdn.net/zsf2951186806/article/details/97369901

版权

Careful Selection of Knowledge to solve Open Book Question Answering

标题：精心选择知识解决开卷问答

作者： Pratyay Banerjee, Chitta Baral

备注：Accepted to ACL 2019

链接：https://arxiv.org/abs/1907.10738

构建开卷问答数据集

感觉扩充了以往阅读理解的文章的大小，同时，涉及一个各个文章知识的结合，或者不可回答的问题？？？

IPRE: a Dataset for Inter-Personal Relationship Extraction

标题：IPRE：一个用于人际关系抽取的数据集

作者： Haitao Wang, Min Zhang

链接：https://arxiv.org/abs/1907.12801

TEQUILA: Temporal Question Answering over Knowledge Bases

标题：龙舌兰：知识库上的时间问答

作者： Zhen Jia, Gerhard Weikum

备注：CIKM 2018

链接：https://arxiv.org/abs/1908.03650

应该是构建了一个数据集吧，还构建了模型，构建数据集不确定，主要针对问题涉及到时间维度的回答

Why Does a Visual Question Have Different Answers?

标题：为什么视觉问题有不同的答案？

作者： Nilavra Bhattacharya, Danna Gurari

链接：https://arxiv.org/abs/1908.04342

视觉问答数据集，分析引起不同回答的原因

Reasoning-Driven Question-Answering for Natural Language Understanding

标题：推理驱动的自然语言理解问答

作者： Daniel Khashabi

链接：https://arxiv.org/abs/1908.04926

博士论文：问答。创建了两个自然语言问题数据集，其中（i）第一个需要推理多个句子; （ii）第二个需要时间常识推理

Controversy in Context

标题：语境中的争议

作者： Benjamin Sznajder, Noam Slonim

链接：https://arxiv.org/abs/1908.07491

A Dataset of General-Purpose Rebuttal

标题：通用反驳数据集

作者： Matan Orbach, Noam Slonim

备注：EMNLP 2019

链接：https://arxiv.org/abs/1909.00393

Large Scale Question Answering using Tourism Data

标题：基于旅游数据的大规模问答

作者： Danish Contractor, Parag Singla

链接：https://arxiv.org/abs/1909.03527

我们收集了一份QA数据集，其中包含48,147个段落大小的真实用户问题，这些问题来自寻求酒店，景点和餐馆推荐的旅行者。每个候选答案都与一组非结构化评论相关联

A Benchmark Dataset for Learning to Intervene in Online Hate Speech

标题：用于学习干预在线仇恨言论的基准数据集

作者： Jing Qian, William Yang Wang

链接：https://arxiv.org/abs/1909.04251

WIQA: A dataset for "What if..." reasoning over procedural text

标题：WIQA：针对程序文本的“假设......”的数据集

作者： Niket Tandon, Peter Clark

备注：Accepted at EMNLP 2019

链接：https://arxiv.org/abs/1909.04739

PubMedQA: A Dataset for Biomedical Research Question Answering

标题：PubMedQA：生物医学研究问题解答的数据集

作者： Qiao Jin, Xinghua Lu

备注：EMNLP 2019

链接：https://arxiv.org/abs/1909.06146

MinWikiSplit: A Sentence Splitting Corpus with Minimal Propositions

标题：MinWikiSplit：一种具有最小命题的句子切分语料库

作者： Christina Niklaus, Siegfried Handschuh

链接：https://arxiv.org/abs/1909.12131

BillSum: A Corpus for Automatic Summarization of US Legislation

标题：BillSum：美国立法自动摘要语料库

作者： Anastassia Kornilova, Vlad Eidelman

链接：https://arxiv.org/abs/1910.00523
BHAAV- A Text Corpus for Emotion Analysis from Hindi Stories

标题：BHAAV-一个用于印地语故事情感分析的文本语料库

作者： Yaman Kumar, Debanjan Mahata

链接：https://arxiv.org/abs/1910.04073
Aff-Wild Database and AffWildNet

标题：AFF-Wild数据库和AffWildNet

作者： Mengyao Liu, Dimitrios Kollias

链接：https://arxiv.org/abs/1910.05318

面部表情情感数据集，以效价与唤醒作为标注，目前最大面部表情情感数据集

Building Dynamic Knowledge Graphs from Text-based Games

标题：基于文本游戏的动态知识图构建

作者： Mikulas Zelinka, Xingdi Yuan

备注：NeurIPS 2019, Graph Representation Learning(GRL) Workshop

链接：https://arxiv.org/abs/1910.09532
IPOD: Corpus of 190,000 Industrial Occupations

标题：iPod：190，000个工业职业的语料库

作者： Junhua Liu, Chu Guo

链接：https://arxiv.org/abs/1910.10495
Emotion Generation and Recognition: A StarGAN Approach

标题：情绪产生和识别：StarGAN方法

作者： Aritra Banerjee, Dimitrios Kollias

链接：https://arxiv.org/abs/1910.11090
DENS: A Dataset for Multi-class Emotion Analysis

标题：Denses：一个用于多类情绪分析的数据集

作者： Chen Liu, Anderson de Andrade

备注：Accepted to EMNLP 2019

链接：https://arxiv.org/abs/1910.11769

多分类情感数据集

ViGGO: A Video Game Corpus for Data-To-Text Generation in Open-Domain Conversation

标题：Viggo：用于开放领域对话中数据到文本生成的视频游戏语料库

作者： Juraj Juraska, Marilyn Walker

备注：Accepted to INLG 2019

链接：https://arxiv.org/abs/1910.12129
Seq2Emo for Multi-label Emotion Classification Based on Latent Variable Chains Transformation

标题：基于潜变量链变换的Seq2Emo多标签情感分类

作者： Chenyang Huang, Osmar R. Zaïane

链接：https://arxiv.org/abs/1911.02147

新搜集了一份最大的数据集

iSarcasm: A Dataset of Intended Sarcasm

标题：iSarcasm：有意讽刺的数据集

作者： Silviu Oprea, Walid Magdy

链接：https://arxiv.org/abs/1911.03123
Scaling Robot Supervision to Hundreds of Hours with RoboTurk: Robotic Manipulation Dataset through Human Reasoning and Dexterity

标题：使用RoboTurk将机器人监控扩展到数百小时：通过人类推理和灵巧度的机器人操作数据集

作者： Ajay Mandlekar, Li Fei-Fei

备注：Published at IROS 2019

链接：https://arxiv.org/abs/1911.04052
An Annotation Scheme of A Large-scale Multi-party Dialogues Dataset for Discourse Parsing and Machine Comprehension</

最低0.47元/天解锁文章

zsf2951186806

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
杂七杂八数据集

Careful Selection of Knowledge to solve Open Book Question Answering标题：精心选择知识解决开卷问答作者： Pratyay Banerjee, Chitta Baral备注：Accepted to ACL 2019链接：https://arxiv.org/abs/1907.10738构建开卷问答数据集感觉扩充了...
复制链接

扫一扫