
大模型微调部署实战及类GPT工具的高效使用
文章平均质量分 92
对大模型微调、部署、调优和DeepSeek等GPT工具使用进行详尽的介绍。本专栏持续更新中。原价99,限时69.9🔥火爆订阅中(五日后恢复原价)。近期更新频率为一周至少3篇,希望能对同学们有所帮助。
优惠券已抵扣
余额抵扣
还需支付
¥69.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
herosunly
985院校硕士毕业,现担任算法工程师一职,获得CSDN博客之星第一名,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次,其中包括阿里云天池比赛第一名,科大讯飞分类挑战赛第一名,CCF信息分类比赛比赛第二名,开放原子分类比赛二等奖,CCF家族分类第四名,科大讯飞阿尔茨海默症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七名。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业。希望和大家一起成长进步。
展开
-
大模型微调部署实战及类GPT工具的高效使用
本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 专栏亮点3. 你的收获4. 详细目录原创 2024-07-24 07:00:00 · 192732 阅读 · 97 评论 -
详解大模型微调数据集构建方法(持续更新)
本文详细介绍了大模型微调数据集构建方法,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四原创 2024-06-05 07:30:00 · 250447 阅读 · 60 评论 -
大模型LoRA微调调参的实战技巧(持续更新)
本文主要介绍了大模型LoRA微调调参的实战技巧,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧原创 2024-05-01 12:08:15 · 190189 阅读 · 67 评论 -
LLaMA Factory单机微调的实战教程
本文主要介绍了使用LLaMA Factory对大模型进行单机微调的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调原创 2024-04-24 22:28:51 · 199338 阅读 · 36 评论 -
huggingface高速下载模型的实战代码
本文主要介绍了huggingface高速下载模型的实战代码,尤其是无法通过国内源进行下载的huggingface模型,希望能对学习大模型的同学们有所帮助。需要特别说明的是,本文的代码是完全原创的,即能够最大限度利用宽度的速度,而且还能实现断点续传。文章目录1. 背景2. 实战代码原创 2024-01-27 11:15:05 · 271152 阅读 · 52 评论 -
基于Cline和OpenRouter模型进行MCP实战
本文主要介绍了基于Cline和OpenRouter模型进行MCP实战,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. MCP实战 2.1 模型选型 2.2 安装环境 2.3 安装MCP服务 2.4 MCP实战3. Bug解决方案原创 2025-04-13 17:24:37 · 17333 阅读 · 10 评论 -
Text2SQL推理类大模型本地部署的解决方案
本文主要介绍了Text2SQL推理类大模型本地部署的解决方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 实战代码原创 2025-03-27 07:30:00 · 14075 阅读 · 17 评论 -
DeepSeek-R1 满血版和蒸馏版鉴别方法
本文主要介绍了DeepSeek-R1 满血版和蒸馏版鉴别方法,希望对使用DeepSeek模型的同学们有所帮助。文章目录1. 前言2. 实战教程 2.1 满血版实验结果 2.2 DeepSeek-R1-Distill-Qwen-7B实验结果 2.3 DeepSeek-R1-Distill-Qwen-32B实验结果 2.4 DeepSeek-R1-Distill-Qwen-70B实验结果3. 总结原创 2025-02-25 14:11:10 · 34274 阅读 · 15 评论 -
DeepSeek R1最强平替模型的实战教程
本文主要介绍了DeepSeek R1最强平替模型的实战教程,希望对使用DeepSeek R1出现服务器繁忙,请稍后再试的同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-02-11 13:08:13 · 42271 阅读 · 4 评论 -
DeepSeek提示词实战教程(持续更新)
本文主要介绍了deepseek提示词实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 推理模型 vs 通用模型3. 提示词实战 3.1 优质提示词库 3.2 提示词优化原创 2025-02-10 17:29:07 · 43371 阅读 · 5 评论 -
DeepSeek R1蒸馏版模型部署的实战教程
本文主要介绍了DeepSeek R1蒸馏版模型部署的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 模型调用原创 2025-02-09 17:55:46 · 45461 阅读 · 0 评论 -
语音转文本SOTA模型部署的实战教程
本文主要介绍了语音转文本SOTA模型部署的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 实战代码原创 2025-03-14 16:47:05 · 21686 阅读 · 0 评论 -
本地部署Embedding模型API服务的实战教程
本文主要介绍了本地部署Embedding模型API服务的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 调用代码原创 2025-02-28 17:54:32 · 30837 阅读 · 10 评论 -
Windows环境下Ollama的本地部署方案
本文主要介绍了Windows环境下Ollama的本地部署方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. Windows环境安装3. API调用示例代码原创 2024-12-09 13:04:01 · 79866 阅读 · 42 评论 -
LLaMA Factory 核心原理讲解
本文主要介绍了LLaMA Factory 核心原理讲解,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 核心模块讲解3. SFT流程讲解原创 2024-10-30 18:09:06 · 110377 阅读 · 54 评论 -
基于RAG构建Text2SQL的实战教程
本文主要介绍了基于RAG构建Text2SQL的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境2.1 安装虚拟环境2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 实战代码原创 2025-01-22 14:44:14 · 49864 阅读 · 3 评论 -
使用langchain和大模型API提取QA的实战教程
本文主要介绍了使用langchain和大模型API提取QA的实战教程,希望能对学习大模型的同学们有所帮助。提取后的json部分内容如下所示。文章目录1. 前言2. 实战教程 2.1 搭建环境 2.2 实战代码 2.3 实战案例原创 2024-10-21 07:15:00 · 107697 阅读 · 40 评论 -
Qwen2.5 本地部署的实战教程
本文主要介绍了Qwen2.5 本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行Qwen2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-23 07:30:00 · 136233 阅读 · 36 评论 -
调用Claude 3.5 API的实战代码
本文主要介绍了调用Claude 3.5 API的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-09-04 18:30:37 · 144272 阅读 · 24 评论 -
基于华为昇腾910B和LLaMA Factory多卡微调的实战教程
本文主要介绍了基于华为昇腾910B和LLaMA Factory多卡微调的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 继续预训练(CPT) 3.4 SFT原创 2024-08-23 22:26:47 · 155081 阅读 · 39 评论 -
详解大模型多轮对话的输入和输出token序列
本文主要介绍了大模型多轮对话的输入和输出token序列,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 内容详解和代码验证原创 2024-12-23 07:30:00 · 74333 阅读 · 35 评论 -
预训练PDF数据格式转换
本文主要介绍了预训练PDF数据格式转换,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. PDF数据格式转换原创 2024-08-12 20:58:48 · 165676 阅读 · 48 评论 -
DeepSeek 2.5本地部署的实战教程
本文主要介绍了DeepSeek 2.5本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行DeepSeek 2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-22 13:19:19 · 169510 阅读 · 24 评论 -
大模型后处理之提取Json结构数据的实战代码
本文主要介绍了大模型后处理之提取Json结构数据的实战代码,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-12-20 21:15:21 · 76662 阅读 · 17 评论 -
详解大模型多轮对话的数据组织形式
本文主要介绍了详解大模型多轮对话的数据组织形式,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. LLaMA Factory适配的多轮对话数据形式3. SWIFT适配的多轮对话数据形式原创 2024-09-06 07:30:00 · 136807 阅读 · 43 评论 -
LLaMA Factory多卡微调的实战教程(持续更新)
本文主要介绍了LLaMA Factory多卡微调的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调 3.3.1 zero3微调 3.3.2 启动API 3.3.3 模型测试原创 2024-06-12 21:30:30 · 234288 阅读 · 19 评论 -
大模型微调和RAG的应用场景
本文主要介绍了大模型微调和RAG的应用场景,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 大模型微调 vs. RAG原创 2024-06-19 22:56:48 · 220645 阅读 · 29 评论 -
使用工作流产生高质量翻译内容的实战教程
本文主要介绍了使用工作流产生高质量翻译内容的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 思路分析3. 实战教程原创 2024-07-22 07:00:00 · 180975 阅读 · 22 评论 -
Langchain-Chatchat本地部署的解决方案
本文主要介绍了Langchain-Chatchat本地部署的解决方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库3. 启动xinference4. 启动Langchain-Chatchat原创 2024-08-28 10:21:15 · 150381 阅读 · 23 评论 -
通过命令行工作流提升工作效率的实战教程(持续更新)
本文主要介绍了通过命令行工作流提升工作效率的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 可选步骤一 2.2 步骤二 2.3 步骤三3. 实战案例原创 2024-07-16 23:17:19 · 185680 阅读 · 33 评论 -
预训练网页数据爬取与预处理
本文主要介绍了预训练网页数据爬取与预处理,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 数据爬取与预处理原创 2024-08-04 22:40:37 · 183170 阅读 · 45 评论 -
大模型提问中包括时间的实战方案
本文主要介绍了大模型提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案原创 2024-07-04 23:02:15 · 198095 阅读 · 19 评论 -
大模型微调出错的解决方案(持续更新)
本文主要介绍了大模型微调出错的解决方案(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 解决方案 2.1 大模型环境配置问题 2.2 实时观测GPU变化 2.3 微调卡住不动原创 2024-06-13 20:00:00 · 194949 阅读 · 32 评论 -
Text2SQL中不同数据库SQL之间转换的实战代码
本文主要介绍了Text2SQL中不同数据库SQL之间转换的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. SQL转换实战代码原创 2024-06-27 18:08:19 · 207494 阅读 · 23 评论 -
Text2SQL基座模型选择的实战教程(持续更新)
本文主要介绍了Text2SQL基座模型选择的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. Text2SQL基座模型的发展史3. 模型选择实战 3.1 prompt模板 3.2 下载模型与部署API 3.3 实战代码4. 补充说明原创 2024-06-21 17:54:11 · 216945 阅读 · 0 评论 -
Text2SQL中反思纠错的实战方案
本文主要介绍了Text2SQL中反思纠错的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 反思纠错的实战方案原创 2024-06-29 12:12:59 · 205711 阅读 · 41 评论 -
Text2SQL提问中包括时间的实战方案
本文主要介绍了Text2SQL提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案原创 2024-07-07 17:46:33 · 194999 阅读 · 20 评论 -
大模型微调选择模型的实战技巧(持续更新)
本文主要介绍了大模型微调选择模型的实战技巧(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧原创 2024-07-11 20:00:00 · 189453 阅读 · 19 评论 -
探寻大模型回答9.9和9.11犯错的根本原因
本文主要介绍了探寻大模型回答9.9和9.11犯错的根本原因,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 分析与思考原创 2024-07-18 19:30:00 · 181478 阅读 · 42 评论 -
Qwen2本地部署的实战教程
本文主要介绍了Qwen2本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件4. 运行Qwen2-7B-Instruct原创 2024-06-07 11:11:56 · 243398 阅读 · 44 评论