IBM Watson的Question Answering系统采用了何种技术--笔记

最新推荐文章于 2021-07-10 23:47:31 发布

Dr-rong

最新推荐文章于 2021-07-10 23:47:31 发布

阅读量851

点赞数

分类专栏：自然语言处理文章标签： watson ibm 结构技术

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/durong123123123/article/details/41947449

版权

自然语言处理专栏收录该内容

4 篇文章 0 订阅

订阅专栏

比较常用的一些QA技术

parsing

question classification

question decomposition

automatic source acquisition and evaluation

entity and relation detection

logical form generation

knowledge representation and reasoning

对计算出的答案到底有多少confidence，在计算的每一步中都要有体现

confidence threshold,只有对问题的confidence超过这个threshold才选择回答，所以可以想象

在被选择回答的问题中，最后的precision应该是比较高的：

100%回答只有40%的precision,40%回答可以达到100%precision, 60回答时可以得到66%precision

这一点才产品级很有用，不要给用户无用的答案，不知为不知，是智也

对问题进行分解，对分解的部分回答，然后综合部分答案得到最后答案，并行问题结构，嵌套问题结构

Question中可能含有一些能代表answer类型的word,这些是十分重要的word,这些word可以帮助

我们确定answer可能会出现在什么环境下，如果没有明确的关键word,我们也应当能够推演出它，应为

answer一定是以某种类型存在的

简单的用key word query去search text也能表现的不错，说明如果能分析出key word,然后做search,在search

结果中做总结是一个不错的做法。

DeepQA强调并行可扩展的体系结构，什么意思？就是说我们不是依赖于某一个特定模块的特定方法，而是给每一个模块一个confidence,然后能够将不同方法产生的结果综合起来，这样产生更加可靠的结果

data corpus 应该可以在seed document的基础上进行自动扩展，从web中抓取有用的信息

Question Analysis的工作包括各种技术的综合应用，包括：

shallow parses, deep parses, logical forms, semantic role labels, coreference, relations,

named entities, and so on.

Question classification很有帮助，a math question? a definition question? or others?

LAT detection,就是识别出question的focus，这个focus可以用来确定answer的类型

更进一步的解释就是：The focus of the question is the part of the question that, if replaced by

the answer, makes the question a stand-alone statement.

但LAT的应用看起来似乎有局限性，应为在Watson中，question是以一种陈述的形式给出的，在

这种形式中，往往代词比如this就圈定了LAT,但在一般的问题形式中是否可以应用有待考察

对question进行Relation detection也很重要。但broad-domain relation detection是一件十分困难的

事情

以上所述的question analysis 工作的目的要达到question decomposition，这个我目前的思路是一致的，

先分解，然后对部分作出高confidence的analysis,然后再进行合成

Hypothesis generation的过程就是产生candidate answers的过程，这个过程可以是一个不断迭代，

逐步求精的过程。各种搜索技术综合应用，文本搜索，KB搜索

candidate answer 和question key 一起可以用来去search一些support evidence，我们可以对search到的support evidence

打分，来决定这个answer是否可信

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
IBM Watson的Question Answering系统采用了何种技术--笔记

parsingquestion classificationquestion decompositionautomatic source acquisition and evaluationentity and relation detectionlogical form generationknowledge representation and reasoning
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。