漫漫AI学习之路_空中楼阁，梦幻泡影的博客-CSDN博客

漫漫AI学习之路

关注

文章平均质量分 84

。记录大模型学习的每寸点滴，沉淀思考、梳理知识点，在实践中打磨认知，于积累中进阶成长，让每一步探索都算数

关注数：文章数：15 文章阅读量：12992 文章收藏量：149

作者: 空中楼阁，梦幻泡影

这个作者很懒，什么都没留下…

展开

专栏收录文章

大模型应用开发平台的技术选型核心逻辑：从业务本质到落地闭环的全链路决策体系

大模型应用开发的技术选型，从来不是 “选参数最高的模型”“选最火的开源框架”，也不是 “选最便宜的 API 平台”，而是一套以业务目标为核心、刚性约束为边界、核心能力为匹配、工程落地为基础、成本与风险为兜底的系统化决策逻辑。本文将完整拆解大模型应用开发平台技术选型的底层逻辑、决策优先级、全流程步骤与避坑指南，形成一套可直接落地的选型方法论。

原创 2026-02-24 09:20:18 · 922 阅读 · 0 评论
2026 最新大模型应用开发平台全解析：选型指南与场景适配全攻略

随着大模型应用进入规模化落地阶段，开发平台的选型成为决定项目落地效率、成本与业务效果的核心因素。本文全面梳理了 2026 年大模型应用开发领域的主流平台体系，按开发门槛、部署模式、业务需求与合规要求，划分为 6 大类核心平台，详细拆解了每类平台的核心优势、主流产品、能力边界与适用场景，并给出了全场景快速选型参考。本文适合个人开发者、中小企业技术团队、政企单位技术负责人阅读，可帮助读者快速匹配适配自身需求的大模型应用开发底座，解决选型难、落地慢的行业痛点

原创 2026-02-24 09:05:20 · 984 阅读 · 0 评论
FP16、FP32、INT8 深度解析：差异、应用场景与工业级落地实践

在深度学习、高性能计算及AI部署领域，FP32（单精度浮点数）、FP16（半精度浮点数）、INT8（8位有符号整数）是最常用的三种数据类型，其核心差异本质是「精度」与「效率」的权衡。多数开发者在项目落地时会困惑：同样是算力载体，三者该如何选型？低精度（FP16/INT8）如何在不损失核心性能的前提下实现加速？本文将从底层原理、核心差异、场景适配、落地案例四个维度，结合代码实操和硬件适配细节，帮你彻底搞懂三者的应用逻辑，贴合工业级落地需求，全程干货无冗余。

原创 2026-02-05 16:30:00 · 942 阅读 · 0 评论
LoRA微调算力估算全攻略：公式、实战案例与工程技巧

在大模型落地过程中，LoRA（Low-Rank Adaptation）微调因“显存占用低、算力需求小”成为主流方案，但多数工程师仍困惑于“LoRA微调算力如何估算”“不同模型、不同配置下需要多少卡、多久能训完”。本文从LoRA微调的算力核心原理出发，拆解关键影响参数，给出工程化可直接套用的简化公式，搭配4个主流大模型（LLaMA-2-7B/13B/70B、Qwen-14B）的实战案例，涵盖单卡/多卡估算、显存与算力的区别，新手也能快速上手，精准规划LoRA微调的资源与时间成本。

原创 2026-02-05 10:15:00 · 920 阅读 · 0 评论
主流4 大模型（GPT、LLaMA、DeepSeek、QWE）的训练与推理算力估算实例详细数据

以下选取GPT-3（大参数量通用大模型）、LLaMA-7B（轻量化开源大模型）、DeepSeek-67B（千亿级推理优化大模型）、QWE-13B（自定义中等参数量大模型），分别演示训练和推理场景的算力估算，贴合实际项目场景，参数参考行业常规配置，沿用前文核心公式，确保可复用、可落地。

原创 2026-02-04 11:24:47 · 692 阅读 · 0 评论
AI项目算力估算全解析：核心因素、关键参数与实操方法

在AI项目落地过程中，算力估算始终是贯穿需求分析、方案设计、资源部署全流程的核心环节——估算不足会导致训练卡顿、推理延迟，无法按时交付；本文将聚焦“AI项目算力如何估算”这一核心问题，拆解算力估算的底层逻辑，详细梳理影响估算结果的关键因素、核心参数，结合实操场景总结估算方法与避坑要点，助力AI工程师、算法工程师快速掌握算力估算技巧，适配不同规模AI项目的资源规划需求。

原创 2026-02-04 11:20:22 · 1243 阅读 · 0 评论
医疗领域大模型LoRA微调示例数据集

医疗领域大模型LoRA微调示例数据集

原创 2026-01-19 10:30:00 · 150 阅读 · 0 评论
使用Ollama部署训练后的模型，详细讲解「训练好的 LoRA 模型 + Ollama」完整部署流程

训练完的 LoRA 微调模型，怎么基于 Ollama 部署上线、实际调用、生产可用。 Ollama 是最优解 —— 它是目前部署大模型最简单、最高效、最轻量化的工具，对新手友好、支持 GPU 加速、部署命令极简、还完美兼容我们训练的LoRA 微调模型，完全不用写复杂的部署代码，和LoRA 训练无缝衔接，这也是企业 / 个人落地垂直领域模型的主流组合方案。

原创 2026-01-19 09:30:00 · 953 阅读 · 0 评论
LoRA 详细解析，使用LoRA 方式对模型进行微调详细操作指南

LoRA（低秩适配）是一种高效的大模型微调技术，通过冻结主模型参数、仅训练插入的小矩阵，实现低成本垂直领域适配。相比全参数微调，LoRA显存需求降低90%，单张消费级显卡即可训练7B模型，产出仅几MB的适配器文件。核心优势包括：保留原模型通用能力、训练速度快、部署灵活（原模型+LoRA文件组合）。实操时99%场景无需编码，使用LLaMAFactory等工具通过配置文件和命令行即可完成，关键步骤是准备高质量的领域数据集（几百条指令-回答对）。该技术已成为医疗、法律等垂直领域微调的首选方案。

原创 2026-01-17 21:40:52 · 1221 阅读 · 0 评论
训练一个垂直领域大模型，真正训练一个模型，不是只做 RAG，到底要做哪些步骤

摘要：大模型训练与知识库的核心区别在于：训练是通过海量数据调整模型参数使其具备通用能力，而知识库是模型可查询的外部信息库。训练垂直领域大模型的流程包括：1)明确目标范围；2)数据准备（占70%重要性）；3)选择基础模型（通常基于已有模型微调）；4)训练阶段（继续预训练或指令微调）；5)对齐优化（RLHF等）；6)专业评估；7)部署监控。整个过程强调数据质量、专业评估和持续更新，训练与知识库相互补充但不可替代。

原创 2026-01-17 21:27:16 · 659 阅读 · 0 评论
Docker 下安装Weavate向量数据库的详细指南

本文介绍了Weavate向量搜索引擎的部署与优化方法。主要内容包括：1）环境准备与Docker安装；2）单节点容器快速启动和Docker Compose部署；3）持久化数据配置与验证安装；4）高级配置建议，包括缓存优化、负载均衡和数据库连接池设置；5）常见问题排查技巧，涉及性能诊断、日志分析和端口冲突解决等。文章提供了详细的命令行示例和配置片段，帮助用户快速搭建和优化Weavate服务。

原创 2026-01-08 14:05:35 · 568 阅读 · 0 评论
实现网站扫描公众号二维码进行登录的详细操作指南

微信扫码登录实现方案摘要：本文详细介绍了基于微信公众号的扫码登录实现方案。系统通过生成带参数的二维码，用户扫码后自动完成身份验证。方案包含前端轮询状态、后端获取微信接口token、处理扫码事件等核心流程。关键技术点包括：1) 使用QR_STR_SCENE生成场景二维码；2) 通过Redis缓存accessToken和登录状态；3) 区分首次关注和已关注用户的处理逻辑。该方案适用于企业内网、电商平台等需要便捷登录的场景，相比传统账号密码方式显著提升用户体验。文中提供了完整的前后端代码示例，包括二维码生成、状

原创 2026-01-08 13:07:41 · 1499 阅读 · 0 评论
Linux下使用docker安装mysql8.0

本文详细介绍了MySQL 8.0.20 Docker容器的配置流程：首先拉取镜像并启动临时容器，创建挂载目录后拷贝配置文件；然后删除原容器，新增自定义my.cnf配置；接着创建包含端口映射、文件挂载等参数的启动脚本；最后进入容器设置远程访问权限。整个过程涵盖了镜像获取、配置持久化、容器优化和安全设置等关键步骤，为搭建可持久化的MySQL容器环境提供了完整指导。

原创 2025-12-19 10:21:26 · 460 阅读 · 0 评论
Docker安装MinIO

本文介绍了MinIO这一高性能、开源的分布式对象存储系统及其在Docker环境下的部署方法。MinIO兼容Amazon S3 API，具有轻量级、高可用等特点，适用于云原生存储、大数据分析等场景。文章详细说明了通过Docker安装MinIO的步骤，包括镜像拉取、目录创建、容器启动配置（端口映射、数据卷挂载、认证设置等）以及安装验证。同时介绍了MinIO的基本使用，如创建存储桶、修改权限和常用管理命令，并提供了官方文档参考链接。通过本文，读者可快速掌握MinIO的核心功能与部署方法。

原创 2025-12-13 10:47:45 · 806 阅读 · 0 评论
Linux和windows下docker环境的安装和使用说明指导

本文详细介绍了Docker容器化平台的安装与配置方法。首先阐述了Docker的概念、优势及其与虚拟机的区别，然后分别讲解了Linux和Windows系统下的安装步骤，包括环境检查、依赖安装等关键环节。文章还提供了Docker常用命令参考，涵盖镜像管理、容器操作、网络配置等内容，并介绍了docker-compose的使用方法。最后针对国内用户提供了配置镜像加速器的解决方案，帮助提高镜像下载速度。本文可作为开发者快速搭建Docker环境的实用指南。

原创 2025-12-03 18:06:46 · 974 阅读 · 0 评论

漫漫AI学习之路

作者: 空中楼阁，梦幻泡影

大模型应用开发平台的技术选型核心逻辑：从业务本质到落地闭环的全链路决策体系

2026 最新大模型应用开发平台全解析：选型指南与场景适配全攻略

FP16、FP32、INT8 深度解析：差异、应用场景与工业级落地实践

LoRA微调算力估算全攻略：公式、实战案例与工程技巧

主流4 大模型（GPT、LLaMA、DeepSeek、QWE）的训练与推理算力估算实例详细数据

AI项目算力估算全解析：核心因素、关键参数与实操方法

医疗领域大模型LoRA微调示例数据集

使用Ollama部署训练后的模型，详细讲解「训练好的 LoRA 模型 + Ollama」完整部署流程

LoRA 详细解析，使用LoRA 方式对模型进行微调详细操作指南

训练一个垂直领域大模型，真正训练一个模型，不是只做 RAG，到底要做哪些步骤

Docker 下安装Weavate向量数据库的详细指南

实现网站扫描公众号二维码进行登录的详细操作指南

Linux下使用docker安装mysql8.0

Docker安装MinIO

Linux和windows下docker环境的安装和使用说明指导