杂七杂八数据集

  • Careful Selection of Knowledge to solve Open Book Question Answering

标题:精心选择知识解决开卷问答

作者: Pratyay Banerjee, Chitta Baral

备注:Accepted to ACL 2019

链接:https://arxiv.org/abs/1907.10738

构建开卷问答数据集

感觉扩充了以往阅读理解的文章的大小,同时,涉及一个各个文章知识的结合,或者不可回答的问题???

  • IPRE: a Dataset for Inter-Personal Relationship Extraction

标题:IPRE:一个用于人际关系抽取的数据集

作者: Haitao Wang, Min Zhang

链接:https://arxiv.org/abs/1907.12801

  • TEQUILA: Temporal Question Answering over Knowledge Bases

标题:龙舌兰:知识库上的时间问答

作者: Zhen Jia, Gerhard Weikum

备注:CIKM 2018

链接:https://arxiv.org/abs/1908.03650

应该是构建了一个数据集吧,还构建了模型,构建数据集不确定,主要针对问题涉及到时间维度的回答

  • Why Does a Visual Question Have Different Answers?

标题:为什么视觉问题有不同的答案?

作者: Nilavra Bhattacharya, Danna Gurari

链接:https://arxiv.org/abs/1908.04342

视觉问答数据集,分析引起不同回答的原因

  • Reasoning-Driven Question-Answering for Natural Language Understanding

标题:推理驱动的自然语言理解问答

作者: Daniel Khashabi

链接:https://arxiv.org/abs/1908.04926

博士论文:问答。创建了两个自然语言问题数据集,其中(i)第一个需要推理多个句子; (ii)第二个需要时间常识推理

  • Controversy in Context

标题:语境中的争议

作者: Benjamin Sznajder, Noam Slonim

链接:https://arxiv.org/abs/1908.07491

  • A Dataset of General-Purpose Rebuttal

标题:通用反驳数据集

作者: Matan Orbach, Noam Slonim

备注:EMNLP 2019

链接:https://arxiv.org/abs/1909.00393

  • Large Scale Question Answering using Tourism Data

标题:基于旅游数据的大规模问答

作者: Danish Contractor, Parag Singla

链接:https://arxiv.org/abs/1909.03527

我们收集了一份QA数据集,其中包含48,147个段落大小的真实用户问题,这些问题来自寻求酒店,景点和餐馆推荐的旅行者。每个候选答案都与一组非结构化评论相关联

  • A Benchmark Dataset for Learning to Intervene in Online Hate Speech

标题:用于学习干预在线仇恨言论的基准数据集

作者: Jing Qian, William Yang Wang

链接:https://arxiv.org/abs/1909.04251

  • WIQA: A dataset for "What if..." reasoning over procedural text

标题:WIQA:针对程序文本的“假设......”的数据集

作者: Niket Tandon, Peter Clark

备注:Accepted at EMNLP 2019

链接:https://arxiv.org/abs/1909.04739

  • PubMedQA: A Dataset for Biomedical Research Question Answering

标题:PubMedQA:生物医学研究问题解答的数据集

作者: Qiao Jin, Xinghua Lu

备注:EMNLP 2019

链接:https://arxiv.org/abs/1909.06146

MinWikiSplit: A Sentence Splitting Corpus with Minimal Propositions

标题:MinWikiSplit:一种具有最小命题的句子切分语料库

作者: Christina Niklaus, Siegfried Handschuh

链接:https://arxiv.org/abs/1909.12131

  • BillSum: A Corpus for Automatic Summarization of US Legislation

    标题:BillSum:美国立法自动摘要语料库

    作者: Anastassia Kornilova, Vlad Eidelman

    链接:https://arxiv.org/abs/1910.00523

  • BHAAV- A Text Corpus for Emotion Analysis from Hindi Stories

    标题:BHAAV-一个用于印地语故事情感分析的文本语料库

    作者: Yaman Kumar, Debanjan Mahata

    链接:https://arxiv.org/abs/1910.04073 

  • Aff-Wild Database and AffWildNet

    标题:AFF-Wild数据库和AffWildNet

    作者: Mengyao Liu, Dimitrios Kollias

    链接:https://arxiv.org/abs/1910.05318

面部表情情感数据集,以效价与唤醒作为标注,目前最大面部表情情感数据集

  • Building Dynamic Knowledge Graphs from Text-based Games

    标题:基于文本游戏的动态知识图构建

    作者: Mikulas Zelinka, Xingdi Yuan

    备注:NeurIPS 2019, Graph Representation Learning(GRL) Workshop

    链接:https://arxiv.org/abs/1910.09532

  • IPOD: Corpus of 190,000 Industrial Occupations

    标题:iPod:190,000个工业职业的语料库

    作者: Junhua Liu, Chu Guo

    链接:https://arxiv.org/abs/1910.10495

  • Emotion Generation and Recognition: A StarGAN Approach

    标题:情绪产生和识别:StarGAN方法

    作者: Aritra Banerjee, Dimitrios Kollias

    链接:https://arxiv.org/abs/1910.11090

  • DENS: A Dataset for Multi-class Emotion Analysis

    标题:Denses:一个用于多类情绪分析的数据集

    作者: Chen Liu, Anderson de Andrade

    备注:Accepted to EMNLP 2019

    链接:https://arxiv.org/abs/1910.11769

多分类情感数据集 

  • ViGGO: A Video Game Corpus for Data-To-Text Generation in Open-Domain Conversation

    标题:Viggo:用于开放领域对话中数据到文本生成的视频游戏语料库

    作者: Juraj Juraska, Marilyn Walker

    备注:Accepted to INLG 2019

    链接:https://arxiv.org/abs/1910.12129

  • Seq2Emo for Multi-label Emotion Classification Based on Latent Variable Chains Transformation

    标题:基于潜变量链变换的Seq2Emo多标签情感分类

    作者: Chenyang Huang, Osmar R. Zaïane

    链接:https://arxiv.org/abs/1911.02147

新搜集了一份最大的数据集

  • iSarcasm: A Dataset of Intended Sarcasm

    标题:iSarcasm:有意讽刺的数据集

    作者: Silviu Oprea, Walid Magdy

    链接:https://arxiv.org/abs/1911.03123

  • Scaling Robot Supervision to Hundreds of Hours with RoboTurk: Robotic Manipulation Dataset through Human Reasoning and Dexterity

    标题:使用RoboTurk将机器人监控扩展到数百小时:通过人类推理和灵巧度的机器人操作数据集

    作者: Ajay Mandlekar, Li Fei-Fei

    备注:Published at IROS 2019

    链接:https://arxiv.org/abs/1911.04052

  • An Annotation Scheme of A Large-scale Multi-party Dialogues Dataset for Discourse Parsing and Machine Comprehension</

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值