How Did Watson Answer? —— Special Questions

最新推荐文章于 2021-07-02 23:50:57 发布

Air_Fighter

最新推荐文章于 2021-07-02 23:50:57 发布

阅读量558

点赞数

分类专栏： Watson 文章标签： AI NLP QA Watson

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Air_Fighter/article/details/49782977

版权

Watson 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

一、摘要

前面曾经提过，Waston能够将题型进行分类，进而选择不同的答题策略。上一篇文章介绍了如何分解处理事实性问题，这篇文章将介绍Waston处理特殊类型的问题。

简单来说，特殊问题分为以下几类：谜语、多选、Common Bond（这个真不知道该怎么翻译好了）、填空(Fill-in-the-Blank,FITB)，以及在标准类型题目中用到了条件约束和双管与的题目。

应对的策略有：问题分解与答案生成、利用题目线索和基于分类的已知答案学习。

二、特殊问题处理技术

(一) 问题分解与答案生成

问题的分解主要是用来解决谜语类问题的，通过匹配手工生成的Prolog规则来检测句子中是否有PAS（predicate-argument structure）。处理流程见下图。

与可平行分解的子问题类似，首先分解成为两个子问题，然后各自生成准候选(Pre-Candidate)集，对比各自的结果，进行对应处理（一般是收尾拼接），得到最终的候选答案。图中只给出了正确答案的生成过程，实际运行过程中，会有数百个候选出现。

(二) 约束与双关语

1. 词典约束

这类的约束大概包括单词长度、开头字母、结尾字母、包含指定字母、包含指定序列、指定韵律等。处理方法，还是找出来最经常出现的几种模式，然后做好规则匹配。

2. 约束对象

采用的方法仍然是规则匹配，但约束类型做了细分，分为：Alliteration、Blank、DoubleLetter、CommonEnding、NLetterRepetitions、Rhyming、SubStringDeisjunction、SyllableCount等。

3. 双关语

天才的IBM攻城狮们总是能找出来一些有用的性质，这次他们发现重复率最高的双关语是对focus进行修饰的引用短语。非官方观点，最常见的双关语无非是homonym、heteronym、homophone。

(三) 学习已知答案

节目中在选手答题之后会公布正确答案，这部分答案就被称为已知答案（Revealed Answer）。在答题过程中，Watson能够根据已知答案自己补全约束类型和问题分类。

背后的原理就是贝叶斯公式，在先验概率足够高的情况下，再开始计算后验概率

三、挑选出的特殊题型

不好意思，各位，我要耍流氓了。由于我们组是在做QA系统，但题型与《Jeopardy!》不尽相同，这里的特殊题型在我们的题库中几乎不会出现，所以，我就不详细整理答题思路了，只对题型作以罗列：

谜语、Before &After and Rhyme Time、数学题、回文构词法与隐藏词汇。

多选题值得一提，Watson会首先识别出题目中的选项，然后利用题目中的剩余信息作出选择。虽然我不知道作出选择的具体方式，但最好的恐怕就是把选项一一放入题干中，形成不同的陈述，对比哪一个陈述的置信度更高。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。