
大模型微调部署实战及类GPT工具的高效使用

文章平均质量分 92
对大模型微调、部署、调优和类GPT工具使用进行详尽的介绍。本专栏持续更新中。原价99,限时69.9🔥火爆订阅中(五日后恢复原价)
优惠券已抵扣
余额抵扣
还需支付
¥69.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
herosunly
985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次,其中包括阿里云天池安全恶意程序检测第一名,科大讯飞恶意软件分类挑战赛第一名,CCF信息分类比赛比赛第二名,CCF家族分类第四名,科大讯飞阿尔茨海默综合症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七名,Datacon大数据安全分析比赛第五名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
展开
-
大模型微调部署实战及类GPT工具的高效使用
本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 专栏亮点3. 你的收获4. 详细目录原创 2024-07-24 07:00:00 · 146799 阅读 · 94 评论 -
详解大模型微调数据集构建方法(持续更新)
本文详细介绍了大模型微调数据集构建方法,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四原创 2024-06-05 07:30:00 · 203880 阅读 · 58 评论 -
大模型LoRA微调调参的实战技巧(持续更新)
本文主要介绍了大模型LoRA微调调参的实战技巧,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧原创 2024-05-01 12:08:15 · 155608 阅读 · 64 评论 -
LLaMA Factory单机微调的实战教程
本文主要介绍了使用LLaMA Factory对大模型进行单机微调的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调原创 2024-04-24 22:28:51 · 164665 阅读 · 36 评论 -
huggingface高速下载模型的实战代码
本文主要介绍了huggingface高速下载模型的实战代码,尤其是无法通过国内源进行下载的huggingface模型,希望能对学习大模型的同学们有所帮助。需要特别说明的是,本文的代码是完全原创的,即能够最大限度利用宽度的速度,而且还能实现断点续传。文章目录1. 背景2. 实战代码原创 2024-01-27 11:15:05 · 236980 阅读 · 52 评论 -
Windows环境下Ollama的本地部署方案
本文主要介绍了Windows环境下Ollama的本地部署方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. Windows环境安装3. API调用示例代码原创 2024-12-09 13:04:01 · 33613 阅读 · 36 评论 -
LLaMA Factory 核心原理讲解
本文主要介绍了LLaMA Factory 核心原理讲解,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 核心模块讲解3. SFT流程讲解原创 2024-10-30 18:09:06 · 65729 阅读 · 54 评论 -
基于RAG构建Text2SQL的实战教程
本文主要介绍了基于RAG构建Text2SQL的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境2.1 安装虚拟环境2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 实战代码原创 2025-01-22 14:44:14 · 4891 阅读 · 0 评论 -
使用langchain和大模型API提取QA的实战教程
本文主要介绍了使用langchain和大模型API提取QA的实战教程,希望能对学习大模型的同学们有所帮助。提取后的json部分内容如下所示。文章目录1. 前言2. 实战教程 2.1 搭建环境 2.2 实战代码 2.3 实战案例原创 2024-10-21 07:15:00 · 62949 阅读 · 40 评论 -
Qwen2.5 本地部署的实战教程
本文主要介绍了Qwen2.5 本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行Qwen2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-23 07:30:00 · 90284 阅读 · 36 评论 -
调用Claude 3.5 API的实战代码
本文主要介绍了调用Claude 3.5 API的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-09-04 18:30:37 · 99381 阅读 · 24 评论 -
基于华为昇腾910B和LLaMA Factory多卡微调的实战教程
本文主要介绍了基于华为昇腾910B和LLaMA Factory多卡微调的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 继续预训练(CPT) 3.4 SFT原创 2024-08-23 22:26:47 · 109639 阅读 · 39 评论 -
详解大模型多轮对话的输入和输出token序列
本文主要介绍了大模型多轮对话的输入和输出token序列,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 内容详解和代码验证原创 2024-12-23 07:30:00 · 29461 阅读 · 35 评论 -
预训练PDF数据格式转换
本文主要介绍了预训练PDF数据格式转换,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. PDF数据格式转换原创 2024-08-12 20:58:48 · 121212 阅读 · 46 评论 -
DeepSeek 2.5本地部署的实战教程
本文主要介绍了DeepSeek 2.5本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行DeepSeek 2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-22 13:19:19 · 108857 阅读 · 22 评论 -
大模型后处理之提取Json结构数据的实战代码
本文主要介绍了大模型后处理之提取Json结构数据的实战代码,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-12-20 21:15:21 · 31953 阅读 · 16 评论 -
详解大模型多轮对话的数据组织形式
本文主要介绍了详解大模型多轮对话的数据组织形式,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. LLaMA Factory适配的多轮对话数据形式3. SWIFT适配的多轮对话数据形式原创 2024-09-06 07:30:00 · 92240 阅读 · 42 评论 -
LLaMA Factory多卡微调的实战教程(持续更新)
本文主要介绍了LLaMA Factory多卡微调的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调 3.3.1 zero3微调 3.3.2 启动API 3.3.3 模型测试原创 2024-06-12 21:30:30 · 189053 阅读 · 19 评论 -
大模型微调和RAG的应用场景
本文主要介绍了大模型微调和RAG的应用场景,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 大模型微调 vs. RAG原创 2024-06-19 22:56:48 · 175582 阅读 · 29 评论 -
使用工作流产生高质量翻译内容的实战教程
本文主要介绍了使用工作流产生高质量翻译内容的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 思路分析3. 实战教程原创 2024-07-22 07:00:00 · 136875 阅读 · 22 评论 -
Langchain-Chatchat本地部署的解决方案
本文主要介绍了Langchain-Chatchat本地部署的解决方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库3. 启动xinference4. 启动Langchain-Chatchat原创 2024-08-28 10:21:15 · 105350 阅读 · 23 评论 -
通过命令行工作流提升工作效率的实战教程(持续更新)
本文主要介绍了通过命令行工作流提升工作效率的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 可选步骤一 2.2 步骤二 2.3 步骤三3. 实战案例原创 2024-07-16 23:17:19 · 141418 阅读 · 33 评论 -
预训练网页数据爬取与预处理
本文主要介绍了预训练网页数据爬取与预处理,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 数据爬取与预处理原创 2024-08-04 22:40:37 · 138956 阅读 · 44 评论 -
大模型提问中包括时间的实战方案
本文主要介绍了大模型提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案原创 2024-07-04 23:02:15 · 153804 阅读 · 19 评论 -
大模型微调出错的解决方案(持续更新)
本文主要介绍了大模型微调出错的解决方案(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 解决方案 2.1 大模型环境配置问题 2.2 实时观测GPU变化 2.3 微调卡住不动原创 2024-06-13 20:00:00 · 161483 阅读 · 32 评论 -
Text2SQL中不同数据库SQL之间转换的实战代码
本文主要介绍了Text2SQL中不同数据库SQL之间转换的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. SQL转换实战代码原创 2024-06-27 18:08:19 · 163225 阅读 · 23 评论 -
Text2SQL基座模型选择的实战教程(持续更新)
本文主要介绍了Text2SQL基座模型选择的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. Text2SQL基座模型的发展史3. 模型选择实战 3.1 prompt模板 3.2 下载模型与部署API 3.3 实战代码4. 补充说明原创 2024-06-21 17:54:11 · 172456 阅读 · 33 评论 -
Text2SQL中反思纠错的实战方案
本文主要介绍了Text2SQL中反思纠错的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 反思纠错的实战方案原创 2024-06-29 12:12:59 · 161456 阅读 · 41 评论 -
Text2SQL提问中包括时间的实战方案
本文主要介绍了Text2SQL提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案原创 2024-07-07 17:46:33 · 150869 阅读 · 20 评论 -
大模型微调选择模型的实战技巧(持续更新)
本文主要介绍了大模型微调选择模型的实战技巧(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧原创 2024-07-11 20:00:00 · 145153 阅读 · 19 评论 -
探寻大模型回答9.9和9.11犯错的根本原因
本文主要介绍了探寻大模型回答9.9和9.11犯错的根本原因,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 分析与思考原创 2024-07-18 19:30:00 · 137295 阅读 · 42 评论 -
Qwen2本地部署的实战教程
本文主要介绍了Qwen2本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件4. 运行Qwen2-7B-Instruct原创 2024-06-07 11:11:56 · 198910 阅读 · 43 评论 -
GLM-4本地部署的实战教程
本文主要介绍了GLM-4-9B本地部署的实战教程,希望对学习和使用大模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行glm-4-9b-chat原创 2024-06-05 18:00:22 · 200644 阅读 · 47 评论 -
windows系统huggingface连接不上的解决方案
本文主要介绍了windows系统huggingface连接不上的解决方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 解决方案 2.1 解决方案一 2.2 解决方案二原创 2024-09-01 21:07:28 · 102021 阅读 · 30 评论 -
LLaMA Factory添加新模型template的实战解析
本文主要介绍了LLaMA Factory添加新模型template的实战解析,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战解析 2.1 检查代码 2.2 修改代码原创 2024-07-29 07:46:12 · 129987 阅读 · 29 评论 -
从System Prompt来看Claude3、Kimi和ChatGLM4之间的差距
本文主要介绍了从System Prompt来看Claude3、Kimi和ChatGLM4之间的差距,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. System Prompt 2.1 Claude3 2.2 Kimi 2.3 ChatGLM4原创 2024-05-29 22:15:41 · 205635 阅读 · 51 评论 -
从System Prompt来看GPT-3.5到GPT-4的进化
本文主要介绍了从System Prompt来看GPT-3.5到GPT-4的进化之路,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. System Prompt 2.1 GPT-3.5 2.2 GPT-4o 2.3 GPT-3.5到GPT-4的进化之路原创 2024-05-23 07:30:00 · 33632 阅读 · 32 评论 -
部署大模型API的实战教程
今天给大家带来的文章是部署大模型API的实战教程,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库3. 运行代码 3.1 修改文件 3.2 运行API 3.3 测试API原创 2024-01-17 07:30:00 · 63407 阅读 · 26 评论 -
Lora Adapter可视化的实战教程
本文主要介绍了Lora Adapter可视化的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 可视化 2.1 示例一 2.2 示例二原创 2024-05-18 11:08:28 · 40431 阅读 · 32 评论 -
GPT-4o模型介绍和使用方法
本文主要讲解了GPT-4o模型介绍和使用方法,希望对学习和使用大模型的同学们有所帮助。文章目录1. 前言2. GPT-4o模型介绍3. GPT-4o使用方法原创 2024-05-15 15:47:49 · 42073 阅读 · 44 评论