PMC-LLaMA: Towards Building Open-source Language Models for Medicine

最新推荐文章于 2024-08-15 09:39:28 发布

UnknownBody

最新推荐文章于 2024-08-15 09:39:28 发布

阅读量594

点赞数

文章标签： llama 语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/132847145

版权

LLM 日更专栏收录该内容

515 篇文章 3 订阅

已下架不支持订阅

本文介绍了PMC LLaMA，一个专为医学应用设计的开源语言模型，通过大规模数据注入和微调在医学问答和推理任务中表现出色，甚至超越ChatGPT。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《PMC-LLaMA: Towards Building Open-source Language Models for Medicine》的翻译。

PMC LLaMA：构建医学开源语言模型

摘要
引言
相关工作
问题定义
数据集构造
实验
结果
结论

摘要

最近，大型语言模型（LLM）在自然语言理解方面展示了非凡的能力。尽管这些模型在日常对话和问答中表现出了熟练程度，但由于缺乏特定领域的知识，它们在需要精确性的领域（如医学应用）中经常会遇到困难。在本文中，我们描述了构建一个专门为医学应用程序设计的强大的开源语言模型的过程，称为PMC LLaMA。我们的贡献有三方面：（i）我们系统地研究了将通用基础语言模型适应医学领域的过程，这包括通过整合480万篇生物医学学术论文和3万本医学教科书，以数据为中心的知识注入，以及与特定领域指令相一致的全面微调；（ii）我们为指令调整提供了一个大规模、全面的数据集。该数据集包括医学问答（QA）、推理原理和对话，共包括202M个token；（iii）我们进行了彻底的消融研究，以证明每个提议组件的有效性。在评估各种公共医疗问答基准时，我们的轻量级PMCLLaMA仅包含130亿个参数，表现出卓越的性能，甚至超过了ChatGPT。所有模型、代码和数据集都可以在https://github.com/chaoyi-wu/PMC-LLaMA找到.

引言

相关工作

问题定义

数据集构造

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
PMC-LLaMA: Towards Building Open-source Language Models for Medicine

最近，大型语言模型（LLM）在自然语言理解方面展示了非凡的能力。尽管这些模型在日常对话和问答中表现出了熟练程度，但由于缺乏特定领域的知识，它们在需要精确性的领域（如医学应用）中经常会遇到困难。在本文中，我们描述了构建一个专门为医学应用程序设计的强大的开源语言模型的过程，称为PMC LLaMA。我们的贡献有三方面：（i）我们系统地研究了将通用基础语言模型适应医学领域的过程，这包括通过整合480万篇生物医学学术论文和3万本医学教科书，以数据为中心的知识注入，以及与特定领域指令相一致的全面微调；
复制链接

扫一扫

专栏目录

已下架不支持订阅

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。