
AI大模型训练实践
文章平均质量分 81
本栏目旨在为对 AI 大模型训练感兴趣的人士搭建交流平台。专栏将深入剖析大模型训练的核心技术,分享实际操作中的经验技巧,从数据预处理、模型架构选择到训练优化等多方面展开,无论是新手初探,还是资深人士希望拓展思路,都能在此找到有价值的内容,共同探索 AI 大模型训练的无限可能。
政安晨
专注于人工智能感知交互技术的研究与产品实践,双一流大学软件领域硕士,数十项发明专利授权,18年+行业经验。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
政安晨的AI大模型训练实践 十二 - 基于千问的Qwen2.5-VL-3B-Instruct 多模态模型进行微调参数认知 3
解释多模态大模型训练过程中的一些必要参数。原创 2025-02-25 15:45:11 · 1656 阅读 · 0 评论 -
政安晨的AI大模型训练实践 十一 - 基于千问的Qwen2.5-VL-3B-Instruct 多模态模型进行微调参数认知 2
微调一个大模型要准备的背景知识还是很多的。 本节我们介绍训练阶段的一些主要参数。原创 2025-02-24 20:13:06 · 1014 阅读 · 0 评论 -
政安晨的AI大模型训练实践 十 - 基于千问的Qwen2.5-VL-3B-Instruct 多模态模型进行微调的基本参数认知
我们开始基于LLaMAFactory工具微调Qwen2.5-VL-3B-Instruct这个多模态模型。开始之前,我们需要在基本术语认知的基础上,对UI中的参数进一步细化理解。工欲善其事,必先......,所以,先学习。原创 2025-02-23 19:28:17 · 1625 阅读 · 0 评论 -
政安晨的AI大模型训练实践 九 - 熟悉LLaMA Factory的详细参数含义-基本概念理解一下
小伙伴铁子们,上手先熟悉起来训练工具的每一个参数,很重要。参照我以前的文章先把您的工具搞起来,然后开干!LLaMAFactory可以成为你启动训练的手边工具。原创 2025-02-21 11:52:58 · 1100 阅读 · 0 评论 -
政安晨的AI大模型训练实践 八 - Open-WebUI启动本地大模型(Ollama)
微调出一个大模型,总想用一用,虽然有很多工具可以选择,但企业级的免费开源工具还是不多,我觉得Open-WebUI具备这样的潜力。原创 2025-02-13 11:15:33 · 362 阅读 · 0 评论 -
政安晨的AI大模型训练实践 七 - AnythingLLM运行vLLM启动地本地自己训练的大模型
大模型的应用并不是一件难事,只要你能够亲自去试试,今天给大家简单演示。我最近用llamafactory微调了一个deepseek-r1-1.5b的本地模型,用vLLM把模型跑起来提供api,用AnythingLLM测试。原创 2025-02-12 14:20:43 · 668 阅读 · 3 评论 -
政安晨的AI大模型训练实践 六 - open-webui & vLLM 运行
简单微调出来一个大语言模型后,需要运行它,虽然ollama很方便,也适合部署。但本地测试的话,还可以使用open-webui 和 vLLM这两个工具。我的博客为了不取悦读者,请自己去查这两个工具是干啥用的,我这里只记录一些命令,做个自己运行的备忘即可。原创 2025-02-12 13:21:36 · 1867 阅读 · 0 评论 -
政安晨的AI大模型训练实践 五:用最小的模型 DeepSeek-R1-1.5B-Distill 尝试训练(用最省事最默认的参数微调一下)
LLaMAFactory工具训练模型的流程包括数据准备、特征工程、模型选择、模型训练、模型评估、模型调优和模型保存和部署。通过这个流程,可以从原始数据到训练好的模型,并在实际应用中使用。原创 2025-02-09 14:39:34 · 1940 阅读 · 4 评论 -
政安晨的AI大模型训练实践四:准备一个合适的模型微调,先试一下,比如:DeepSeek-R1-14B-Distill
我们尝试使用 DeepSeek-R1-14B-Distill这个DeepSeek R1 14B的蒸馏模型来微调。微调一个有一定参数规模的大模型比如14B的DeepSeek-R1大概准备200G以上的空间。原创 2025-02-08 16:49:26 · 606 阅读 · 2 评论 -
政安晨的AI大模型训练实践三:熟悉一下LF训练模型的WebUI
LLaMA-Factory 支持通过 WebUI 零代码微调大语言模型。原创 2025-01-25 18:16:01 · 685 阅读 · 0 评论 -
政安晨的AI大模型训练实践二:理解数据
在AI大模型训练中,数据具有非常重要的作用。数据是训练模型的基础,决定了模型的质量和能力。以下原创 2025-01-23 17:51:05 · 1351 阅读 · 0 评论 -
政安晨的AI大模型训练实践一:工欲善其事者,必先利其器
在这个AI时代,每个人都应该掌握一点训练AI模型的能力,这个栏目的系列片将为大家各位小伙伴徐徐展开拥有这套本领的能力。原创 2025-01-21 13:29:39 · 844 阅读 · 0 评论