文献阅读｜基于大型语言模型的慢性病辅助诊断聊天机器人问答系统

小天才学习机打游戏

于 2024-10-04 10:45:00 发布

阅读量344

点赞数 9

文章标签：语言模型机器人人工智能知识图谱学习计算机视觉 llama

本文链接：https://blog.csdn.net/m0_59164520/article/details/142657950

版权

导言

近年来，人工智能取得了显著的进步，改善了我们日常生活的各个方面。然而，它们在辅助疾病诊断，特别是慢性病方面的作用尚未得到充分探索。本研究采用了GPT系列的大型语言模型，并结合深度学习技术，设计并开发了一个针对慢性病的诊断系统，命名为Chat Ella。该系统可以根据用户描述的症状，对慢性病进行精确预测。

研究要点

1.研究利用GPT-2模型开发了Chat Ella，一个能够根据用户描述的症状，精确预测慢性病的智能系统。通过深度学习和精心训练，该系统能够进行有效的远程诊断。

2.Chat Ella的后端采用结构化诊断方法，前端界面设计为聊天形式，确保了实时准确的症状反馈和卓越的用户体验。

3.未来将集成语音输入和图像识别功能，进一步提升系统的多模态数据处理能力。

本期DH智库将解读《基于大型语言模型的慢性病辅助诊断聊天机器人问答系统》一文，探讨该系统在提升慢性病诊断效率、改善患者体验、以及其在医疗领域的广泛应用前景。

1.人工智能应用现状

及项目特色

1.人工智能在医疗服务领域潜在的成就

会话代理（CAs），也称为AI聊天机器人，是能够通过自然语言进行交流的应用。随着大型语言模型的兴起，OpenAI的基于 Transformer 的生成式预训练模型（GPT）变得突出。这些模型在广泛的文本数据集上进行训练，可以生成自然语言，并针对各种语言任务进行微调。

1）智能诊断领域的研究表明，**使用大型语言模型在临床环境中进行放射学决策支持是可行的，确立了它们作为改善临床工作流程的有效工具。**COVID-19大流行期间的隔离措施提高了人们对在线医疗治疗的认识和理解。

2）**GPT可以生成放射学报告以节省放射科医生的时间，或者通过提供差异性和精炼的信息来协助诊断决策。**它甚至可以与患者沟通，提供有关检查结果和后续治疗建议的信息。

2.项目创新点

在当前的技术背景下，本研究全面利用了GPT-2深度学习模型。通过精心的训练、优化和封装过程，成功设计并开发了一个智能系统，用于辅助慢性病的诊断—Chat Ella。该系统能够与患者进行对话，深入询问相关症状，从而提供初步的诊断结果。这项研究的创新之处主要体现在以下领域：

1）本研究采用了GPT-2，一个大规模预训练语言模型，对丰富的疾病症状文本语料库进行深入学习，为慢性病的远程诊断开辟了新的可能性。

2）为了让用户更直观地体验和利用训练成果，我们特别封装了软件，并实现了一个会话界面，显著增强了系统的交互性和用户友好性。

3）通过计算机可用性问卷（CUQ）的可用性测试，我们不仅确保了系统的功能实现，还进一步验证了它在现实场景中的实用性和用户满意度，保证了系统的效率和可靠性。

（图来自原文：Chat Ella 界面)

2.模型训练

1.数据采集

从Kaggle（一个在线数据科学和机器学习竞赛平台）获取了公开可用的原始数据，并从中提取了特征。为确保模型的效率和准确性，团****队对数据进行了精心的组织和预处理，为Chat Ella模型的训练和性能优化奠定了坚实的基础。

2.模型的构建及训练

GPT-2 是由Open AI在2019年发布的，用于自然语言处理和生成的模型。该架构主要由大型变换器解码器块组成，这些解码器块整合了位置编码。

GPT-2架构主要由大型变换器解码器块组成，这些解码器块整合了位置编码。在每个解码器块内部，多头自注意力机制和多层感知器被层归一化和丢弃层所包围。这种架构设计被证明能增强模型捕捉短期和长期依赖关系的能力，从而提高预测的稳定性和准确性。

（表来自原文：GPT-2 结构图）

3.数据预处理及微调

1）在数据预处理阶段，执行了以下操作：

（1）去重：为确保数据的质量和多样性，从数据集中删除了所有重复的条目。

（2）文本清洗：从文本中移除了无关信息、格式错误和特殊字符，以确保每个条目都具有统一且清晰的格式。

（3）分词和编码：为了让文本数据适合模型处理，对文本进行了分词，并使用了特定的编码方法将其转换为模型能够识别的数值序列。

2）微调

为了使GPT-2能够更准确地诊断患者症状，团队对模型进行了微调。**目标是基于患者症状描述预测潜在的慢性病，构成一个多类别分类任务。**用于微调的数据来自一个经过预处理的医疗数据集，其中每个条目都包含了患者的病状描述及其相应的疾病标签。

3.Chat Ella的集成系统设计

在Chat Ella的集成系统设计中，用户输入的症状描述、数据库检索和对话响应必须紧密同步，以便向用户提供及时准确的医疗症状反馈。系统的整体架构兼顾了后端处理和前端用户界面设计，共同确保了卓越的用户体验和系统性能。

1.后端系统架构

Chat Ella 采用了一种基于用户提供的症状描述的结构化诊断方法。

1）它根据症状的重要性或普遍性进行最优排序，以确保初步过滤。对于数据库中每个可用的症状描述，Chat Ella 能够实时响应，促进与用户的实时双向交流。收到用户查询后，系统从数据库检索相关数据，在后端进行处理，然后以消息的形式发送回给用户。

2）诊断工作流程的核心在于用户输入的每个症状与数据库中存储的常见疾病对应症状之间的比较分析。每当一个症状与特定疾病相符时，该疾病就会被添加到潜在条件列表中。这个过程会持续进行，直到用户描述的所有症状都被匹配。

3）完成整个过程后，Chat Ella 会识别与用户描述最匹配的疾病，根据匹配概率对它们进行排序，然后向用户提供最有可能的疾病信息。这种高度优化的工作流程确保了在短期内向用户提供准确且明确的诊断反馈。

（图来自原文：Chat Ella 的整体系统架构)

2.前端用户界面设计

虑到可视化后端数据结果并确保用户体验的完整性，我们的目标是在保持普遍交互逻辑的同时最小化用户摩擦。Chat Ella的前端被设计为一个会话界面，最初的界面原型是使用Sketch版本83.1创建的。

4.系统开发结果

1.辅助诊断模型的结果

模型在测试集上展示了出色的整体性能。特别值得关注的是曲线下面积（AUC）值，它接近1，表明模型在区分不同慢性病方面具有很高的辨别能力。此外，准确率、精确度、召回率和F1分数都超过了0.97，这表明模型在预测正确疾病分类以及区分阳性和阴性样本方面表现良好。

（图来自原文：辅助诊断模式的评估结果)

2.后端开发结果

在本研究的后端应用程序构建中，采用了flask框架，这一选择因其在管理Web应用程序方面的灵活性和简单性而闻名。

1）模型和分词器加载

在主后端函数’index’中，从transformer库加载了预训练的GPT-2模型及其对应的分词器（GPT-2分词器和用于序列分类的GPT-2）。这些模型和分词器专为文本分类设计，帮助建立疾病标签映射。

（图来自原文：疾病状况标签分类）

2）结果呈现和数据反馈

预测概率向量首先通过softmax函数处理以获得预测概率分布。随后，系统向用户展示每个疾病类别的预测概率及其相应的标签。预测结果被格式化为JSON，并通过‘jsonify’函数返回到前端。在后端的最后部分，使用条件语句确保正确的数据输入，并相应地调用flask应用程序。

（图来自原文：疾病预测过程)

3.前端开发结果

1）在页面上构建并展示了Ella聊天机器人的虚拟形象，以更直观地引导用户交互。用户可以直接在界面中输入他们的症状描述，并与Chat Ella聊天机器人交互以接收相关响应和建议。

2）当用户在聊天界面输入症状描述并点击发送按钮时，系统评估他们的输入并将其添加到消息数组中，提供最佳对应建议。如果没有检测到与症状相关的语句，则显示提示，建议用户提供更详细的症状描述。

3）聊天界面还具有菜单选项。当用户点击菜单图标时，他们可以查看或隐藏各种菜单选项。

（图来自原文：Chat Ella 对话系统用户界面设计截图)

4.问卷结果

奇数编号的问题着重于聊天机器人体验的积极方面。在关于Chat Ella可用性的正面反馈中，“聊天机器人在初始设置期间用户友好”（问题7）和“它很容易使用”（问题15）平均得分最高，为3.76分。正面问题中平均得分最低的是问题1、5和11，平均得分为3.70分。偶数编号的问题着重于消极方面。

（图来自原文：聊天机器人可用性问卷的平均排名)

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述