80老翁谈人生(291):揭开沃森超级电脑的神秘面纱
当今,国外媒体掀起鼓吹IBM沃森超级电脑的狂浪,每天新闻不断。沃森超级电脑是什么“神物”?它的工作原理如何?
2016年6月,美国知名人工智能专家JamesHendler教授(1957- )应邀在国际人工智能大会(IJCAI 2016)上深入浅出地讲解了沃森超级电脑的工作原理,值得一读。
他说:我们把沃森超级电脑设想为一间环形办公室走廊,每一间办公室都有一群人做着特殊的工作,让我们从头来梳理整个运行过程。
- 问题输入(QUESTION IN)
- 问题分析 (Question Analysis)
这个问题什么意思?
我们在找什么?
还存在其他有效信息么?
问题中有没有词语提到问题中的其他词语?
在这一环节,IBM的DeepQA软件自动尝试去理解这个问题,搞清楚问题到底在问什么,同时做一些初步的分析来确定选择哪种方法来应对这个问题。
- 初步搜索 (Primary Search)
在数据库中能不能找到或许跟这个问题有关的文件?
找到了多少文件?
这些文件从哪里来的?
- 搜索结果处理并生成备选答案 (Search Result Processing and Candidate Answer Generation)
在这些文件中,有这个问题可能的答案么?
有多少个备选答案?
当问一个问题时,一份文档就打开了。文档在办公室中不断移动时,更多信息被添加进去了。
- 上下文无关回答得分 (Context-Independent Answer Scoring)
这个选择有可能是正确的答案吗?
这个选择是正确的答案形式吗?
- 软滤波( Soft Filtering)
有哪些选择是明显错误的?
如果是的话,能不能让它们在后面的处理过程中不占太多的时间?
每个可能的回答都被给定一个分数,给出这个证据对备选答案支持得到底有多好。
- 支持证据检索( Supporting Evidence Retrieval)
能在数据库中找到任何能够证明某个选择答案是正确的信息吗?
对每个选择来说有多少信息在哪?
- 搜索结果处理和上下文相关得分 (Search Result Processing and Context Dependent Scoring)
选择工作作为问题回答怎么样?
现在有更多的信息,能给每个选择什么分数?
- 最终合并并排名(Final Merging and Ranking)
每个选择的总分是多少?
哪个选择分数最高?
分数第二高的选择是什么?
还有任何能够改变分数的额外信息吗?
DeepQA也观察到了这种现象:不同的表面形式通常会被不同的证据支持,并得到完全不同但潜在互补的分数,这产生了一种方法:将答案分数在排名和信心计算之前先合并掉。
- 输出答案 (ANSWER OUT)
有用的最高分答案被返回,然后沃森尝试判断从它做的多好(或者多坏)中进行学习。
由此可见,Waltson的工作原理就是“实事求是”,不是耍嘴皮子。
袁以