人工智能会话代理在医疗保健中的有效性:系统综述

weixin_45352758

已于 2022-11-24 10:57:12 修改

阅读量996

点赞数

分类专栏：泛读论文文章标签：人工智能

于 2022-11-23 16:12:08 首次发布

本文链接：https://blog.csdn.net/weixin_45352758/article/details/128002473

版权

#论文泛读
##The Effectiveness of Artificial Intelligence Conversational Agents in Health Care: Systematic Review
翻译
人工智能会话代理在医疗保健中的有效性:系统综述
背景:对卫生保健服务的高需求和人工智能能力的不断增长导致了会话代理的发展，旨在支持各种健康相关的活动，包括行为改变、治疗支持、健康监测、培训、分诊和筛查支持。这些任务的自动化可以解放临床医生专注于更复杂的工作，并增加公众获得卫生保健服务的可能性。需要对这些药物在卫生保健中的可接受性、可用性和有效性进行全面评估，以整理证据，以便未来的发展能够针对需要改进的领域和可持续采用的潜力。

目的:本系统综述旨在评估会话代理在医疗保健中的有效性和可用性，并确定用户喜欢和不喜欢的元素，为未来这些代理的研究和开发提供参考。

方法:系统检索PubMed、Medline (Ovid)、EMBASE(摘录pta Medica数据库)、CINAHL(护理及相关健康文献累积索引)、Web of Science和计算机协会数字图书馆，检索自2008年以来发表的评估在医疗保健中使用的无约束自然语言处理会话代理的文章。采用EndNote (version X9, Clarivate Analytics)文献管理软件进行初步筛选，全文筛选由1名审稿人进行。数据被提取出来，由一名审查员评估偏见的风险，由另一名审查员验证。

结果:共选取31项研究，包括各种会话代理，包括14个聊天机器人(其中2个为语音聊天机器人)，6个具身会话代理(其中3个为交互式语音响应呼叫、虚拟患者和语音识别筛选系统)，1个上下文问答代理，1个语音识别分诊系统。总的来说，报告的证据大多是积极的或好坏参半的。可用性和满意度表现良好(27/30和26/31)，四分之三的研究发现积极或混合有效性(23/30)。然而，在具体的定性反馈中强调了代理人的几个局限性。

结论:研究普遍报告了被调查的会话代理的有效性、可用性和满意度的积极或混合证据，但定性的用户感知更混合。许多研究的质量有限，需要改进研究设计和报告，以便更准确地评估这些制剂在健康方面的效用关注并识别需要改进的关键区域。进一步的研究还应该分析代理的成本效益、隐私和安全性。
关键词人工智能;《阿凡达》;聊天机器人;会话剂;数字健康;智能助理;语音识别软件;虚拟助理;虚拟教练;虚拟医疗;虚拟护理;语音识别软件

背景对话代理是被引入卫生部门的众多数字技术之一，以应对当前的卫生保健挑战，如卫生保健提供者短缺，这降低了卫生保健服务的可用性和可及性[1-3]。会话代理使用人工智能(AI)，包括机器学习(一种用数据训练模型的统计方法，使模型能够基于各种特征进行预测)和自然语言处理(NLP;识别和分析口头和书面语言的能力)，在移动、基于web或基于音频的平台上通过语音、文本或其他输入和输出与人类互动[1,4]。
许多这样的代理都设计为使用NLP，以便用户可以像对人一样对代理说话或写东西。然后代理可以分析输入并以对话的方式进行适当的响应[5]。
1966年，随着虚拟心理治疗师(ELIZA)的开发，会话代理首次作为医疗保健工具出现，它可以为基于文本的用户输入[6]提供预先确定的答案。在此后的几十年里，NLP的能力有了显著的进步，并帮助开发了更先进的AI代理。许多使用NLP的不同类型的会话代理已经被开发出来，包括聊天机器人、嵌入式会话代理(ECAs)和虚拟患者，并可通过电话、移动电话、计算机和许多其他数字平台访问[7-10]。会话代理能够接收和解释的输入类型也有所扩展，一些会话代理能够分析动作，如手势、面部表情和眼球运动[11,12]。
已经为卫生部门的许多不同方面开发了对话代理，以支持卫生保健专业人员和公众。具体用途包括健康状况筛查、分诊、咨询、家庭健康管理支持和卫生保健专业人员培训[8,13-15]。

随着电话、移动和在线平台的广泛使用，会话代理可以为获得卫生保健有限或卫生知识贫乏的人群提供支持[16,17]。
它们也有可能以可承受的价格扩大规模，以覆盖人口的很大一部分。由于这种可访问性，会话代理也是促进以患者为中心的护理的一种有前途的工具，可以支持用户参与自己的健康管理[17,18]。
个性化功能有可能进一步提高可用性和满意度，尽管还需要更多的研究评估他们在实现所述健康结果和降低成本方面的有效性，并确保对决策或隐私没有负面影响[10]。
尽管有大量关于会话代理在医疗保健中的应用的研究，但大多数综述都将其重点局限于特定的健康领域、代理类型或功能[10,19-22]。虽然最近有一些系统的审查审查了更全面的范围，但它们是对知识体系的全面综合。
一项综述开发了一种分类法，描述了医疗保健中会话代理的体系结构和功能以及该领域的状态，但没有评估其有效性、可用性或对用户[5]的影响。另一项系统综述调查了对话性代理研究的结果测量，但将纳入标准限制在使用自然语言输入并已在人类参与者[2]上进行测试的代理。此外，他们最初的数据库搜索只检索到1531篇文章，这让人担心一些相关文章可能被忽略了[2]。他们的研究在2018年2月进行了更新，但鉴于技术发展的快速步伐，有必要对之前的这些系统综述进行更新和扩展。
要使会话代理在医疗保健中取得成功，了解当前代理在实现预期结果方面的有效性是至关重要的。然而，了解用户对这些代理的感受和联系也同样重要，因为新健康技术的采用取决于用户的看法(例如，他们是否信任该技术，发现它易于使用，并感到隐私和数据安全受到尊重)[23]。如果会话代理要对医疗保健产生重大影响，就需要解决用户识别的问题，因为会话代理的影响取决于人们是否愿意使用它们，并更喜欢使用它们而不是替代方案。本综述中收集的信息确定了对话代理目前需要克服的问题，并可用于帮助确定代理的哪些元素最有可能在医疗保健的各个方面取得成功和有用。由于对话代理常常被吹捧为有可能减轻保健资源负担，因此也需要评估这些代理对改善保健提供和减少资源需求的影响。
本综述的主要目的是描述当前用于卫生保健活动的会话代理的范围(由患者、卫生保健提供者或一般公众)，检查用户对这些代理的感知，以及评估他们的有效性。我们开发了3个主要的研究问题来解决这些目标。首先，被调查的对话代理是否有效地达到了预期的健康相关结果，其有效性是否因代理的类型而不同?第二，用户如何评价会话代理的可用性和满意度，他们喜欢和不喜欢代理的哪些具体元素?最后，会话代理在医疗保健中的应用目前有哪些限制和差距?这些目标建立在以前的系统回顾的基础上，同时扩大所纳入研究的范围，以更新卫生保健中会话代理的知识体系，并为未来的研究和开发提供信息。
本综述的全部方法已在系统综述协议[24]中详细发表。人群、干预、比较和结果框架[25]用于制定搜索策略，该策略遵循PRISMA-P(系统回顾和荟萃分析协议首选报告项目)清单[26]实施。没有使用研究设计过滤器;任何类型的