问答系统一些综述性质的文章

问答系统对话管理

揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎 | PaperDaily #25

MSRA周明博士解读:聊天机器人的三大引擎(视频+PPT)

知识图谱

NLP:人工智能的诗和远方

京东团队:智能对话系统综述

吴俣传

Deep Language Modeling for Question Answering using Keras
http://blog.csdn.net/mmc2015/article/details/51643802

全球最精准自然语言解析器 SyntaxNet
https://www.oschina.net/p/syntaxnet

文本自动摘要工具 TextTeaser 开源
http://www.oschina.net/news/52981/textteaser-opensource

Automatic text summarizer
http://www.open-open.com/lib/view/open1456572939812.html

深度学习解决机器阅读理解任务的研究进展
https://zhuanlan.zhihu.com/p/22671467

QA问答系统中的深度学习技术实现:
http://www.tuicool.com/articles/zyUreqM

TextTeaser:自动文本摘要算法开源
http://geek.csdn.net/news/detail/3010

百度阅读理解数据集
阅读是人类获取知识的一个重要途径,智能机器也需要具备阅读理解能力以实现持续学习和进化。机器阅读理解(Machine Reading Comprehension) 研究近年来受到广泛关注,任务通常定义为:让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解涉及到理解、推理、摘要等复杂技术,极具挑战。

为了促进阅读理解技术的发展,百度发布了大规模中文阅读理解数据集DuReader。首批发布的数据集包含20万来自百度搜索用户的真实问题,100万来自互联网的真实文档,以及42万人工撰写生成的优质答案。同时,数据集还标注了问题类型、实体和观点等丰富信息,并提供开源基线系统和评测平台。DuReader是迄今为止最大的面向真实需求的中文阅读理解数据集。希望该数据集的发布为阅读理解研究提供有力支撑,加速自然语言理解和人工智能研究的发展。

数据集下载地址:https://ai.baidu.com/broad/subordinate?dataset=dureader
数据集介绍论文:https://arxiv.org/abs/1711.05073
开源基线系统: https://github.com/baidu/DuReader

欢迎学术界和工业界的同仁们基于该数据集进行阅读理解相关研究!

除了阅读理解数据集,百度AI公开数据集计划BROAD(Baidu Research Open-Access Dataset)还发布了视频和图像数据集,更多数据集参见:https://ai.baidu.com/broad

AI可以做什么?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值