太强了！各个行业的AI大模型：医疗、心理、法律、金融、教育....

大模型微调部署

已于 2024-09-11 20:50:46 修改

阅读量1.7k

点赞数 29

文章标签：人工智能金融大模型 AI大模型 AI 教育医疗

于 2024-08-22 10:17:13 首次发布

本文链接：https://blog.csdn.net/star_nwe/article/details/141420658

版权

一、医疗领域大模型

1、DoctorGLM

基于ChatGLM-6B的卓越中文问诊模型，它融合了海量的中文医疗对话数据集进行精准微调，采用lora、p-tuningv2等前沿技术实现高效部署。

项目地址： https://github.com/xionghonglin/DoctorGLM
论文地址： https://arxiv.org/abs/2304.01097

2、BenTsao (本草）

该项目集大成者，开源了多款经过中文医学指令微调的大语言模型，涵盖LLaMA、Alpaca-Chinese、Bloom等，皆以医学知识图谱和医学文献为基础，结合ChatGPT API精心打造，实现了中文医学指令微调数据集的精准训练，极大提升了医疗领域问答的准确性与实用性。

项目地址： https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese
论文地址： https://arxiv.org/abs/2304.06975

3、Med-ChatGLM

该项目同样基于中文医学指令微调，对ChatGLM-6B模型进行了深度优化，微调数据与BenTsao项目一脉相承，确保了模型在医疗领域的卓越表现。

项目地址： https://github.com/SCIR-HI/Med-ChatGLM

4、BianQue (扁鹊）

该项目开创性地推出了生活空间健康大模型，深度整合了当前开源的中文医疗问答数据集，结合自建的生活空间健康对话大数据，构建了千万级别的扁鹊健康大数据BianQueCorpus，基于此精心打造了ChatGLM-6B为初始化的BianQue模型，全面提升了模型在医疗与健康领域的应用价值。

项目地址： https://github.com/scutcyr/BianQue

5、HuatuoGPT (华佗）

该项目鼎力推出医疗大模型HuatuoGPT，其中包括了基于Baichuan-7B训练的HuatuoGPT-7B与基于Ziya-LLaMA-13B-Pretrain-v1的HuatuoGPT-13B，旨在提供全方位、高标准的医疗智能服务。

项目地址： https://github.com/FreedomIntelligence/HuatuoGPT
论文地址： https://arxiv.org/abs/2305.15075

6、QiZhenGPT

该项目通过启真医学知识库的精妙运用，构建了独具匠心的中文医学指令数据集，进一步在Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B等尖端模型上精心调整指令，显著提升了模型在中文医疗环境中的实用效果。

项目地址： https://github.com/CMKRG/QiZhenGPT

7、ChatMed

该项目创新性地发布了中文医疗大模型ChatMed-Consult，以ChatMed_Consult_Dataset中超过50万的中文医疗在线问诊数据及ChatGPT的精准回复作为训练基石，基于LlaMA-7b并通过LoRA技术进行了细致微调。

项目地址： https://github.com/michael-wzhu/ChatMed

8、ShenNong-TCM-LLM（神农）

该项目推出了中文中医药领域的杰出模型ShenNong-TCM-LLM，以中医药知识图谱为基础，运用实体为核心的自指令方法，通过ChatGPT生成了丰富的2.6万+中医药指令数据集ChatMed_TCM_Dataset，再基于LlaMA底座，借助LoRA技术进行了精准微调。

项目地址： https://github.com/michael-wzhu/ShenNong-TCM-LLM

9、XrayGLM

该项目开创了中文多模态医学数据集与模型的先河，尤其在医学影像诊断与多轮交互对话中展现出卓越的潜能。

项目地址： https://github.com/WangRongsheng/XrayGLM

10、MedicalGPT

该项目隆重推出了医疗大模型MedicalGPT，集成了增量预训练、有监督微调、RLHF（奖励建模、强化学习训练）和DPO（直接偏好优化）等前沿技术。

项目地址： https://github.com/shibing624/MedicalGPT

11、Sunsimiao（孙思邈）

该项目推出了中文医疗大模型Sunsimiao，该模型以baichuan-7B和ChatGLM-6B为坚实底座，在数十万条高质量的中文医疗数据中进行了精心微调。

项目地址： https://github.com/thomas-yanxin/Sunsimiao

12、CareLlama（关怀羊驼）

该项目推出了医疗大模型CareLlama，并汇集了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型，旨在为医疗LLM的快速发展注入强劲动力。

项目地址： https://github.com/itsharex/CareLlama

在这里插入图片描述

二、4大心理健康领域大模型

1、MeChat

该项目致力于开源中文心理健康支持对话大模型与数据集。该模型基于ChatGLM-6B LoRA 16-bit指令进行了细致的微调。同时，我们通过ChatGPT技术将真实的心理互助QA改写为多轮的心理健康支持多轮对话，构建了含有56k个多轮对话的丰富数据集。该数据集的主题、词汇和篇章语义丰富多样，特别适用于长程多轮对话的应用场景。

项目地址：https://github.com/qiuhuachuan/smile

2、SoulChat (灵心）

该项目开源了心理健康大模型SoulChat（灵心）。该模型源于ChatGLM-6B的深厚底蕴，经过百万规模心理咨询领域的中文长文本指令与多轮共情对话数据的精心微调，得以诞生。它不仅仅是一个模型，更是人们心灵的守护者，静静倾听，深情理解。

项目地址： https://github.com/scutcyr/SoulChat

3、MindChat（漫谈）

这一项目致力于开源心理大模型MindChat。经过人工精心清洗的约20万条高质量多轮心理对话数据，涵盖了工作、家庭、学习、生活、社交、安全等多个层面，为模型的训练提供了丰富的素材。MindChat期望从心理咨询、心理评估、心理诊断、心理治疗四个维度，为人们带来心灵的慰藉与解脱，提升整体的心理健康水平。

项目地址： https://github.com/X-D-Lab/MindChat

4、QiaoBan（巧板）

在儿童情感陪伴领域，QiaoBan这一儿童情感对话大模型应运而生。它基于开源通用大模型，融合了通用域人机对话、单轮指令数据以及专为儿童设计的情感陪伴对话数据，经过精心微调，最终形成了这款专为儿童量身打造的情感陪伴大模型。

项目地址： https://github.com/HIT-SCIR-SC/QiaoBan

三、法律领域微调模型及

1、LawGPT_zh（獬豸）

这一中文法律通用模型源自ChatGLM-6B与LoRA 16-bit指令的精心融合。数据集方面，项目团队不仅利用了现有的法律问答数据集，更通过self-Instruct技术，基于法条和真实案例构建了高质量的法律文本问答数据，大幅提升了模型在法律领域的表现，确保了回答的专业性和可靠性。

项目地址： https://github.com/LiuHC0428/LAW-GPT

2、LaWGPT

LaWGPT系列模型在通用中文基座模型的基础上，增添了法律领域的专有词表和大规模中文法律语料，极大地增强了模型在法律领域的基础语义理解能力。结合法律领域对话问答数据集、中国司法考试数据集的指令精调，LaWGPT对法律内容的理解和执行能力得到了显著提升。

项目地址： https://github.com/pengxiao-song/LaWGPT

3、LexiLaw

LexiLaw，这一中文法律大模型，以ChatGLM-6B为架构基础，经过法律领域数据的精心微调，使得其在法律咨询与支持方面展现出卓越的性能和专业性。无论是法律从业者、学生还是普通用户，LexiLaw都能为他们提供准确、可靠的法律咨询服务，助力他们在法律问题的海洋中乘风破浪。

项目地址： https://github.com/CSHaitao/LexiLaw

4、Lawyer LLaMA

这一项目开源了法律领域的指令微调数据和基于LLaMA训练的中文法律大模型Lawyer LLaMA。Lawyer LLaMA以其卓越的性能和深度，为法律领域带来了前所未有的创新与突破。LLaMA经过大规模法律语料库的预训练，深入系统地学习了中国的法律知识体系。在此基石之上，我们借助ChatGPT的智慧，搜集了一系列针对中国国家统一法律职业资格考试客观题的分析和法律咨询的回答，并通过对这些宝贵数据的指令微调，使模型具备了将法律知识灵活应用于各种具体场景的能力。

项目地址： https://github.com/AndrewZhe/lawyer-llama

论文地址： https://arxiv.org/abs/2305.15062