一、医疗领域大模型
1、DoctorGLM
基于ChatGLM-6B的卓越中文问诊模型,它融合了海量的中文医疗对话数据集进行精准微调,采用lora、p-tuningv2等前沿技术实现高效部署。
项目地址: https://github.com/xionghonglin/DoctorGLM
论文地址: https://arxiv.org/abs/2304.01097
2、BenTsao (本草)
该项目集大成者,开源了多款经过中文医学指令微调的大语言模型,涵盖LLaMA、Alpaca-Chinese、Bloom等,皆以医学知识图谱和医学文献为基础,结合ChatGPT API精心打造,实现了中文医学指令微调数据集的精准训练,极大提升了医疗领域问答的准确性与实用性。
项目地址: https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese
论文地址: https://arxiv.org/abs/2304.06975
3、Med-ChatGLM
该项目同样基于中文医学指令微调,对ChatGLM-6B模型进行了深度优化,微调数据与BenTsao项目一脉相承,确保了模型在医疗领域的卓越表现。
项目地址: https://github.com/SCIR-HI/Med-ChatGLM
4、BianQue (扁鹊)
该项目开创性地推出了生活空间健康大模型,深度整合了当前开源的中文医疗问答数据集,结合自建的生活空间健康对话大数据,构建了千万级别的扁鹊健康大数据BianQueCorpus,基于此精心打造了ChatGLM-6B为初始化的BianQue模型,全面提升了模型在医疗与健康领域的应用价值。
项目地址: https://github.com/scutcyr/BianQue
5、HuatuoGPT (华佗)
该项目鼎力推出医疗大模型HuatuoGPT,其中包括了基于Baichuan-7B训练的HuatuoGPT-7B与基于Ziya-LLaMA-13B-Pretrain-v1的HuatuoGPT-13B,旨在提供全方位、高标准的医疗智能服务。
项目地址: https://github.com/FreedomIntelligence/HuatuoGPT
论文地址: https://arxiv.org/abs/2305.15075
6、QiZhenGPT
该项目通过启真医学知识库的精妙运用,构建了独具匠心的中文医学指令数据集,进一步在Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B等尖端模型上精心调整指令,显著提升了模型在中文医疗环境中的实用效果。
项目地址: https://github.com/CMKRG/QiZhenGPT
7、ChatMed
该项目创新性地发布了中文医疗大模型ChatMed-Consult,以ChatMed_Consult_Dataset中超过50万的中文医疗在线问诊数据及ChatGPT的精准回复作为训练基石,基于LlaMA-7b并通过LoRA技术进行了细致微调。
项目地址: https://github.com/michael-wzhu/ChatMed
8、ShenNong-TCM-LLM(神农)
该项目推出了中文中医药领域的杰出模型ShenNong-TCM-LLM,以中医药知识图谱为基础,运用实体为核心的自指令方法,通过ChatGPT生成了丰富的2.6万+中医药指令数据集ChatMed_TCM_Dataset,再基于LlaMA底座,借助LoRA技术进行了精准微调。
项目地址: https://github.com/michael-wzhu/ShenNong-TCM-LLM
9、XrayGLM
该项目开创了中文多模态医学数据集与模型的先河,尤其在医学影像诊断与多轮交互对话中展现出卓越的潜能。
项目地址: https://github.com/WangRongsheng/XrayGLM
10、MedicalGPT
该项目隆重推出了医疗大模型MedicalGPT,集成了增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)等前沿技术。
项目地址: https://github.com/shibing624/MedicalGPT
11、Sunsimiao(孙思邈)
该项目推出了中文医疗大模型Sunsimiao,该模型以baichuan-7B和ChatGLM-6B为坚实底座,在数十万条高质量的中文医疗数据中进行了精心微调。
项目地址: https://github.com/thomas-yanxin/Sunsimiao
12、CareLlama(关怀羊驼)
该项目推出了医疗大模型CareLlama,并汇集了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型,旨在为医疗LLM的快速发展注入强劲动力。
项目地址: https://github.com/itsharex/CareLlama
二、4大心理健康领域大模型
1、MeChat
该项目致力于开源中文心理健康支持对话大模型与数据集。该模型基于ChatGLM-6B LoRA 16-bit指令进行了细致的微调。同时,我们通过ChatGPT技术将真实的心理互助QA改写为多轮的心理健康支持多轮对话,构建了含有56k个多轮对话的丰富数据集。该数据集的主题、词汇和篇章语义丰富多样,特别适用于长程多轮对话的应用场景。
项目地址:https://github.com/qiuhuachuan/smile
2、SoulChat (灵心)
该项目开源了心理健康大模型SoulChat(灵心)。该模型源于ChatGLM-6B的深厚底蕴,经过百万规模心理咨询领域的中文长文本指令与多轮共情对话数据的精心微调,得以诞生。它不仅仅是一个模型,更是人们心灵的守护者,静静倾听,深情理解。
项目地址: https://github.com/scutcyr/SoulChat
3、MindChat(漫谈)
这一项目致力于开源心理大模型MindChat。经过人工精心清洗的约20万条高质量多轮心理对话数据,涵盖了工作、家庭、学习、生活、社交、安全等多个层面,为模型的训练提供了丰富的素材。MindChat期望从心理咨询、心理评估、心理诊断、心理治疗四个维度,为人们带来心灵的慰藉与解脱,提升整体的心理健康水平。
项目地址: https://github.com/X-D-Lab/MindChat
4、QiaoBan(巧板)
在儿童情感陪伴领域,QiaoBan这一儿童情感对话大模型应运而生。它基于开源通用大模型,融合了通用域人机对话、单轮指令数据以及专为儿童设计的情感陪伴对话数据,经过精心微调,最终形成了这款专为儿童量身打造的情感陪伴大模型。
项目地址: https://github.com/HIT-SCIR-SC/QiaoBan
三、法律领域微调模型及
1、LawGPT_zh(獬豸)
这一中文法律通用模型源自ChatGLM-6B与LoRA 16-bit指令的精心融合。数据集方面,项目团队不仅利用了现有的法律问答数据集,更通过self-Instruct技术,基于法条和真实案例构建了高质量的法律文本问答数据,大幅提升了模型在法律领域的表现,确保了回答的专业性和可靠性。
项目地址: https://github.com/LiuHC0428/LAW-GPT
2、LaWGPT
LaWGPT系列模型在通用中文基座模型的基础上,增添了法律领域的专有词表和大规模中文法律语料,极大地增强了模型在法律领域的基础语义理解能力。结合法律领域对话问答数据集、中国司法考试数据集的指令精调,LaWGPT对法律内容的理解和执行能力得到了显著提升。
项目地址: https://github.com/pengxiao-song/LaWGPT
3、LexiLaw
LexiLaw,这一中文法律大模型,以ChatGLM-6B为架构基础,经过法律领域数据的精心微调,使得其在法律咨询与支持方面展现出卓越的性能和专业性。无论是法律从业者、学生还是普通用户,LexiLaw都能为他们提供准确、可靠的法律咨询服务,助力他们在法律问题的海洋中乘风破浪。
项目地址: https://github.com/CSHaitao/LexiLaw
4、Lawyer LLaMA
这一项目开源了法律领域的指令微调数据和基于LLaMA训练的中文法律大模型Lawyer LLaMA。Lawyer LLaMA以其卓越的性能和深度,为法律领域带来了前所未有的创新与突破。LLaMA经过大规模法律语料库的预训练,深入系统地学习了中国的法律知识体系。在此基石之上,我们借助ChatGPT的智慧,搜集了一系列针对中国国家统一法律职业资格考试客观题的分析和法律咨询的回答,并通过对这些宝贵数据的指令微调,使模型具备了将法律知识灵活应用于各种具体场景的能力。
项目地址: https://github.com/AndrewZhe/lawyer-llama
论文地址: https://arxiv.org/abs/2305.15062
5、HanFei (韩非)
HanFei-1.0作为国内首个全参数训练的法律大模型,拥有高达7b的参数量,其功能涵盖法律问答、多轮对话、文章撰写、检索等多元化需求。
项目地址: https://github.com/siat-nlp/HanFei
最后分享
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
1. 成长路线图&学习规划
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
2. 大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
3. 大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
4. 大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
5. 大模型面试题
面试,不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费
】
如有侵权,请联系删除。