沃森和医疗保健

最新推荐文章于 2024-09-06 19:15:00 发布

cuxiong8996

最新推荐文章于 2024-09-06 19:15:00 发布

阅读量678

点赞数

文章标签：大数据编程语言 python 机器学习人工智能

原文链接：https://www.ibm.com/developerworks/opensource/library/os-ind-watson/index.html

版权

“我首先欢迎我们的新计算机霸主” – 74岁的危险人物 Ken Jennings ！冠军。

2011年2月16日，IBM超级计算机Watson在游戏Jeopardy中击败了两个人类历史上的冠军！在国家电视台上危险！是一款独特的人类问答游戏。这些问题通常是带有双关，讽刺和幽默的细微差别。电脑甚至可以玩这个游戏是一项了不起的成就，更不用说击败人类冠军了！经过50多年的失望之后，人工智能时代终于到来了吗？更具体地说，沃森（Watson）的智慧能否用于在游戏节目之外推动科学和商业发展？与之前的Deep Blue一样，Watson最初是对最先进技术的公开展示，但很可能在未来几年内对整个社会产生重大影响。那么，沃森在现实世界中有哪些应用？

似乎Watson的第一个实际应用将用于医疗保健。通过在护理时为医生回答问题，有可能帮助改善医疗质量并减少代价高昂的错误。在本文中，我将讨论Watson背后的DeepQA技术如何用于解决医疗保健中的特定问题。本文提供的所有信息均基于Watson研究团队发表的科学论文以及IBM高管进行的公开采访。 IBM仍在明确制定如何将DeepQA应用于医疗领域。

我要特别感谢哥伦比亚大学内外科医生学院临床医学教授Herbert Chase博士，他是IBM在Watson在临床决策支持中的应用的重要合作者。

沃森有真正的“智慧”吗？

判断人工智能的最佳方法之一是艾伦·图灵（Alan Turing）在1950年提出的图灵测试。该测试是让人类法官与可能是人或机器的另一方进行自然语言对话。如果在对话结束时，法官们无法可靠地确定哪一方是人，哪一方是机器，则可以说机器已经通过了图灵测试并展示了人工智能。沃森虽然可以很好地回答人类的问题，但却无法与人类进行长时间的交谈。因此，不，沃森还没有达到图灵的真正人工智能标准。有人可以说沃森只是在寻找答案。它没有智能来真正理解问题或答案。

但是，从实际的角度来看，沃森可以帮助人们解决问题。如果不是严格意义上的人工智能（AI），那么沃森无疑是扩展人类大脑的智力论证（IA）。

临床决策支持系统的简要历史

40年来，临床决策支持系统（CDSS）承诺将彻底改变医疗保健。实际上，当政府最近在所有医疗保健机构中强制使用电子健康记录（EHR）系统时，主要目标之一是根据从EHR收集的患者数据，使用CDSS促进更好，更便宜的医疗保健。通过新安装的EHR系统收集的大量新数据，像Watson这样的计算机将能够比人的大脑更有效地找到临床问题的最佳答案。

CDSS的两个主要类别是诊断支持工具和治疗支持工具。诊断支持可帮助医生根据患者的症状，用药和病历做出更好的诊断。诊断错误是针对医疗保健提供者的医疗事故诉讼的首要原因（请参阅参考资料）。因此，帮助医生避免常见的认知错误并做出更好的诊断是当务之急。另一方面，治疗支持可帮助临床医生遵守已知的治疗指南，例如避免已知的药物相互作用，向合适的患者分配正确的药物以及及时更换导管。

第一代CDSS专注于诊断支持。差异诊断工具（例如DXPlain）使用贝叶斯推理决策过程来一次考虑一项临床发现（例如症状或实验室结果），然后计算各种潜在诊断的统计概率。这种系统的知识库是将临床发现与诊断联系起来的大量先验概率。这些第一代工具的问题在于，医生很少有时间坐在计算机前，在医疗记录中进行筛选，然后一次将发现的内容输入计算机。然后，在出现几种可能的诊断后，医生必须研究潜在的治疗选择。由于初级保健医生每位患者仅花费15分钟，因此现在这尤其成问题。

第二代临床决策支持工具旨在改善工作流程和易用性。此类别中的代表产品是伊莎贝尔。伊莎贝尔有两项重大创新。首先，它从EHR中的医生记录中获取自然语言的患者摘要，识别摘要中包含的关键字和发现，然后从其概率数据库中生成相关诊断的列表。其次，伊莎贝尔（Isabel）索引发表了医学文献以提供每种诊断的治疗选择，并与诊断一起向医生提出治疗建议。解析医师笔记和医学文献中的自然语言过程是一项重大创新，使伊莎贝尔倍受青睐。

但是，即使使用了伊莎贝尔（Isabel），以电子方式提取医生备忘，然后再寻找答案仍然常常太慢。一项研究表明，当使用大段文本时，Isabel的诊断是准确的，但是当输入包含较少的文本时，准确性会大大降低（请参阅参考资料）。

对于受过训练的医学专业人员，解决令人困惑的发现或找到新疗法的更好方法通常只是问一个更有经验的临床医生。

简单问答的力量

根据BMJ （英国医学杂志）1999年发表的一项观察性研究，一组研究人员在一个工作日内观察了103位医生。这些医生在白天询问了1,101个临床问题。这些问题中的大多数（64％）从未得到回答。而且，在确实得到回答的问题中，医生花了不到两分钟的时间来寻找答案。在1,101个问题中，只有两个问题触发了试图对其进行回答的医师的文献搜索。因此，提供对临床问题的快速解答可能会对提高医疗质量产生重大影响（请参阅参考资料）。输入Watson。

人们经常问，谷歌不是已经这样做了吗？当然，您可以在Google中输入临床发现或诊断，然后搜索答案。实际上，在《新英格兰医学杂志》上发表的一篇引人注目的医疗案例中，有一位医生使用Google作为诊断辅助工具（请参阅参考资料）。但是，谷歌从根本上说是一个关键字搜索引擎。它返回文档而不是答案。

“巴黎希尔顿”问题

Google的自然语言查询问题的一个很好的例证就是“巴黎希尔顿问题”。如果有人在搜索引擎中输入“ Paris Hilton”，那么Google不会知道该人是否在法国寻找酒店或名人八卦。回答此类问题的唯一方法是让计算机通过对自然语言的分析来“理解”上下文。

Google不明白这个问题。医生负责将问题解析为关键字组合，以产生正确的Google结果。除了最简单的拟事实问题之外，事实证明这是一项艰巨的任务。实际上，整本书中都有关于如何优化搜索查询以充分利用Google的书籍。
Google会为每个查询找到数百万个文档，并按关键字相关性对结果进行排序。用户需要阅读文档并根据上下文分析含义，然后提取潜在答案的列表。

因此，尽管Google非常有用，尤其是在回答事实性问题时，但它与CDSS工具所面临的问题相同：它只是需要医生花费太多时间和精力，才能使其用作日常决策支持工具。

在BMJ于2006年发表的一项研究中，两名研究人员对《新英格兰医学杂志》上发表的诊断病例进行了整整一年的评估，并评估了受过训练的专业人员是否可以通过简单地评估Google搜索结果来得出诊断。请注意，研究人员必须查看案例以构建搜索查询，然后浏览Google的结果以识别潜在的诊断-这是一项劳动密集且耗时的过程。答案是，他们可以在58％的情况下遇到正确的诊断（请参阅参考资料）。 Watson希望能够在节省人类临床医生时间和精力的同时提高这些百分比。

为了更好地分析Google与Watson的关系，回答了有关Jeopardy的问题！，请参阅“ 相关主题”部分中Danny Sullivan的文章。

沃森行动

要查看Watson可以回答的问题，请查看David Ferrucci博士在CeBIT 2011开幕式上向德国总理默克尔和土耳其总理埃尔多安展示的两个示例问题。尝试在Google中键入这些问题，以了解从文档列表中解析答案有多么困难，以及错过频率较低的诊断有多么容易。

问题：链球菌引起儿童期的“发烧”，其特征是鲜红色的皮疹和高温。
答：98％猩红热，15％风湿热，8％链球菌性喉炎
问题：患有关节炎的家族病史患者如果出现圆形皮疹，发烧和头痛，会导致葡萄膜炎。
答：76％的莱姆病，1％的贝切特氏病，1％的结节病

从CDSS工作流的角度来看，我们需要在Google之类的搜索引擎之上添加自然语言和语义层，以便计算机可以实际回答问题。这正是沃森所做的。

此外，Watson根据可以通过精炼的二级搜索收集到的证据评估每个潜在答案。这使Watson可以为每个答案给出置信度。这对于医疗问答系统至关重要，因为它可以防止医生犯下的非常常见的认知错误类型-过早关闭。当医生形成并接受诊断并且一旦诊断后面对新证据就无法考虑合理的替代方案时，就会发生过早关闭。例如，当一位大餐后病人走进办公室抱怨胸部不适时，医生诊断出胃灼热并开了简单的药物治疗胃灼热。但是，当患者后来恶化并表现出明显的心脏病发作时，医生无法考虑心脏病发作的可能性，因为他不知道为什么胃灼热药物无效，最终给患者开了更多的胃灼热药物。当医生被“锚定”到错误的结论时，就会发生这种类型的诊断错误。在这种情况下，向问与答系统提问，为什么胃灼热药物无效，可以挽救生命。沃森可以在提醒医生考虑低概率但可能严重的病例方面做得很好。

沃森的语言

从技术角度来看，图1显示了Watson回答问题的步骤。总而言之，这些步骤是：

Watson解析自然语言问题以生成搜索查询。
沃森（Watson）的嵌入式搜索引擎搜索大型文档知识库以查找相关文档。
Watson解析基于自然语言的搜索结果，并生成潜在答案（假设）。
1. 对于每个假设，Watson都会构建并启动另一个搜索以收集支持该假设的证据。
2. 沃森（Watson）的嵌入式搜索引擎针对每种假设搜索支持证据。
3. 再次解析搜索结果，并对每个证据的强度进行评分。
4. 现在，根据所有支持证据的强度为每个假设分配分数。
假设变成返回给用户的答案列表。

Watson执行的关键任务包括自然语言处理（步骤1、3和3c），搜索（步骤2、3a和3b）以及证据评分（步骤3d和4）。（查看图1的大图。）

图1. Watson回答问题的工作流程

从根本上讲，自然语言解析和证据评分都在处理和评估非结构化文本文档。在Watson内部，基于Apache UIMA（非结构化信息管理体系结构）项目的软件组件执行这些任务。 Watson针对每个问题生成多个搜索查询，并使用各种不同的搜索技术从知识库中找到假设或证据。 Watson中使用的搜索技术包括Apache Lucene（对结果进行排名的术语频率），Indri（对结果进行排名的贝叶斯网络）和SPARQL（术语与文档之间的搜索关系）。请参阅相关主题。

沃森和开源软件

对于Watson所采用的所有复杂性和高级算法，Watson系统很大程度上基于免费提供的开源软件。 Apache UIMA，Apache Lucene，Indri和SPARQL以及Jena Toolkit都是开源软件。具体来说，Watson使用开源软件作为基本框架，但以专有算法为基础构建为插入该框架的组件。开源软件已经成为软件创新的关键推动因素。

沃森的推理方式是从大量文档中生成假设（即候选答案），而不是像人类通常那样从先入为主的理论中生成假设。实际上，科学研究的主要趋势是“挖掘”数据发现。在沃森试图模仿人类智能的同时，人们似乎也更像沃森那样思考！有关此问题的更多信息，请参见“ 相关主题”部分，以获取《连线》杂志上的出色文章。

Apache UIMA

Apache UIMA项目是OASIS UIMA规范的开源实现。 UIMA提供了可扩展的体系结构框架来运行诸如Watson之类的文本处理应用程序。

UIMA框架的关键功能是它允许将应用程序（用UIMA术语称为组件）链接在一起。这样，每个应用程序组件可以专注于一个文本处理任务，并将结果传递给链中的下一个组件以完成更多工作。这非常适合本文前面概述的Watson工作流。

此外，UIMA提供了一个称为UIMA-AS的并行处理框架，该框架允许同时执行多个组件。对于Java™开发人员，UIMA-AS框架基于另一个Apache开源框架ActiveMQ，该框架使用Java Messaging Services来促进任务之间的异步通信。对于Watson，一旦生成了一组假设，计算机就应该能够独立地为每个假设独立收集和评分证据。例如，图1中的所有平行线表示可以由多个CPU同时处理的任务。 UIMA-AS是Watson可以利用2880个CPU提出危险的原因！在3秒内回答。该体系结构还允许UIMA部署在需要时进行缩减。例如，“医师助理”应用程序可能不需要在几秒钟内给出答案，因此此类应用程序的硬件要求可能大大低于Watson。

从应用程序开发人员的角度来看，编写UIMA应用程序主要由注释器组成。注释器是Java或C ++类，可以获取一段输入文本并从中提取结构化信息。 UIMA文档中有一篇很棒的教程，介绍如何编写注释器以使用正则表达式提取自由文本的地址和房间号。

显然，自然语言处理不仅仅需要通过正则表达式提取结构化文本。已经开发出大量算法来检测，标记，标记，分类和解析自然语言段落中的单词，阶段和句子，以根据上下文提取其含义。 UIMA的开源框架方法的主要优势在于，它鼓励其他开发人员贡献实现这些已知算法的注释程序，从而使新开发人员的工作更加轻松。标准UIMA发行版中已经包含了几种常用的注释器，以帮助开发人员快速入门。 UIMA网站上有许多可供下载的大型注释器资源库，包括OpenNLP（开放自然语言处理）注释器和IBM Semantic Search注释器。 IBM Semantic Search注释器允许您在文档库中搜索由具有特定名称的人创作的所有文档。

通过Watson的开发，IBM团队在UIMA上开发了许多注释器。实际上，为了评估从搜索结果文档中提取的每条证据的有效性，需要进行大量工作来开发评分功能。根据Watson团队的说法，为Jeopardy开发了100多种评分功能！项目，并且这些UIMA注释符是Watson可以从搜索返回的大量文档中正确识别单个正确答案的原因。与Google一样，沃森的秘诀也不在于如何找到答案，而在于如何对答案进行评分和排名，从而使最有可能的答案排在首位。

软件框架

大多数软件开发人员都熟悉框架的概念。在Java开发领域中，有数百种从Web到数据建模的广泛使用的框架。在C ++世界中，标准模板库（STL）是一个众所周知的框架。该框架为应用程序提供了API（应用程序编程接口）。在框架上构建的应用程序遵循框架提供的架构模式，并将许多平凡的任务委托给框架库。

阿帕奇·卢森（Apache Lucene）

如前所述，Watson搜索大型文档数据库以生成假设，然后为每个假设找到支持证据。用于索引和搜索那些非结构化文本文档的关键搜索引擎之一是Apache Lucene。

Apache Lucene是功能齐全的免费文本索引器和用Java编写的搜索引擎。它提供了一组简单的API，使开发人员可以轻松地将搜索引擎嵌入到自己的应用程序中。开发人员可以自定义如何为文档建立索引并对其相关性进行评分。 Lucene还支持类似于Google查询语言（您可以在Google搜索框中键入的运算符）的丰富查询语言。

Lucene嵌入在Watson内，以索引大型文档存储库：琐事数据库和《危地马拉》的 Wikipedia文章！以及医疗保健方面的医学出版物。 UIMA注释器根据需要调用Lucene在问答过程的各个阶段搜索文档库。此类医学数据库的示例包括经过同行评审的医学出版物存储库（例如Medline ）以及官方治疗指南，例如医疗保健研究与质量局（AHRQ）国家指南信息交换所。

Lucene不仅可以根据词频对文档中的自由文本进行索引，还可以存储UIMA从文档中提取的结构化信息。通过存储结构化信息，可以通过元数据（例如作者姓名或是否包含纽约市的地址）搜索文档。 UIMA处理文档数据库中的自然语言文本时，会创建通用分析结构（CAS）对象，其中包含从文档，类型系统和索引中提取的结构化结果。 Lucene CAS索引器（Lucas）是UIMA附带的标准注释器。 Lucas将CAS信息保存到Lucene索引文件中。

UIMA和Lucene共同为Watson形成了分析和知识引擎。即使Watson的注释器和算法不是开源的，在Jeopardy上的成功演示！ show验证了整体方法，并为开发人员提供了在特定领域中创建类似应用程序的途径。

医疗保健中自然语言处理的未来

医疗保健中的自然语言处理已超越了问题和答案。 2008年，著名的科学杂志《自然》（ Nature）发表了有关医学研究如何进入大数据领域的专刊。科学发现过程正在从理论，假设，实验和证明转变为直接挖掘数据以得出结论。尽管《自然》杂志将基因组数据作为大数据挖掘的目标，但我们可以争辩说，自然语言文本数据也是研究的宝贵资源。

例如，随着EHR系统被政府强制采用，医生的便笺以计算机可读格式被数字化。它是一个庞大的信息库，可用于收集症状指标，治疗效果和潜在的医疗错误。实际上，Mayo Clinic和IBM已经宣布建立合作伙伴关系，以开源Mayo为挖掘自己的病历而开发的许多UIMA注释器。

挖掘患者报告的数据是另一个有趣的领域。诸如PatientLikeMe和癌症在线资源协会（ACOR）之类的患者社区已经收集了来自患者的大量电子邮件，论坛帖子，博客帖子以及自我监控数据。基于这些数据已经进行了重要的研究，以鉴定在FDA试验中未发现的药物不良React，以及治疗效果的比较研究。使用自然语言工具，我们可以将这些研究提高到一个新的水平。

Watson使用开源软件和现成的硬件向我们展示了可以完成的工作。围绕Watson的研发工作已经开始以IBM对UIMA，UIMA-AS和相关模块的贡献的形式向开发者社区分红。现在，开发人员可以编写创新的应用程序来利用这些功能！

翻译自: https://www.ibm.com/developerworks/opensource/library/os-ind-watson/index.html

cuxiong8996

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
沃森和医疗保健

“我首先欢迎我们的新计算机霸主” – 74岁的危险人物 Ken Jennings ！冠军。 2011年2月16日，IBM超级计算机Watson在游戏Jeopardy中击败了两个人类历史上的冠军！在国家电视台上危险！是一款独特的人类问答游戏。这些问题通常是带有双关，讽刺和幽默的细微差别。电脑甚至可以玩这个游戏是一项了不起的成就，更不用说击败人类冠军了！经过50多年的失望之后，人...
复制链接

扫一扫