DrQA基于维基百科数据的开放域问答机器人实战教程

最新推荐文章于 2024-07-25 18:39:37 发布

weixin_33739646

最新推荐文章于 2024-07-25 18:39:37 发布

阅读量322

点赞数

文章标签：人工智能系统架构

原文链接：https://yq.aliyun.com/articles/619931

版权

目录：
官方介绍
实战

DrQA 是一个基于维基百科数据的开放域问答系统，它由检索器和阅读器组成。其中检索器用于从海量的文本（例如维基百科）中获得相关的文章；阅读器用于从文章中获得相应的答案。

一 . 官方介绍
DrQA是一个应用于开放域问答的阅读理解系统。特别是，DrQA的目标是“大规模机读”（MRS）。在这个设定中，我们在可能非常大的非结构化文档集中搜索问题的答案。因此，系统必须将文档检索（查找相关文档）的挑战与机器对文本的理解（从这些文档中识别答案）的挑战相结合。

我们使用DrQA的实验侧重于回答factoid问题，同时使用Wikipedia作为文档的独特知识源。维基百科是一个非常适合大规模，丰富，详细信息的来源。为了回答任何问题，必须首先在超过500万个文章中检索可能相关的文章，然后仔细扫描它们以确定答案。

请注意：
DrQA将Wikipedia视为一个通用的文章集合，并不依赖于其内部知识结构。因此，DrQA可以直接应用于任何文档集合。

数据集：维基百科
框架：PyTorch
版本：PyTorch torch-0.3.0
论文：Reading Wikipedia to Answer Open-Domain Questions
项目：https://github.com/facebookresearch/DrQA
系统架构：

二. 实战

交互模式下提问（一）：
where is stanford university

可以看到检索到的文档是 Stanford University，问题的答案是：浅绿色标注的部分，答案非常的精准。

交互模式下提问（二）：
where is Barack Hussein Obama from

回答不是很精准，我其实想问的是奥巴马来自哪里。答案返回的是奥巴马在哪里，奥巴马在华盛顿，不过也还是相当不错。

交互模式下提问（三）：
who is Donald Trump

这个问题并没有找到准确的答案，虽然文档是相关的。

原文发布时间为：2018-07-26
本文作者：fendouai
本文来自云栖社区合作伙伴“磐创AI”，了解相关信息可以关注“磐创AI”。

weixin_33739646

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DrQA基于维基百科数据的开放域问答机器人实战教程

目录：官方介绍实战DrQA 是一个基于维基百科数据的开放域问答系统，它由检索器和阅读器组成。其中检索器用于从海量的文本（例如维基百科）中获得相关的文章；阅读器用于从文章中获得相应的答案。一 . 官方介绍DrQA是一个应用于开放域问答的阅读理解系统。特别是，DrQA的目标是“大规模机读”（MRS）。在这个设定中，我们在可能非常大的非结构化文档集中搜索问...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。