漫漫AI学习之路
文章平均质量分 84
。记录大模型学习的每寸点滴,沉淀思考、梳理知识点,在实践中打磨认知,于积累中进阶成长,让每一步探索都算数
空中楼阁,梦幻泡影
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型应用开发平台的技术选型核心逻辑:从业务本质到落地闭环的全链路决策体系
大模型应用开发的技术选型,从来不是 “选参数最高的模型”“选最火的开源框架”,也不是 “选最便宜的 API 平台”,而是一套以业务目标为核心、刚性约束为边界、核心能力为匹配、工程落地为基础、成本与风险为兜底的系统化决策逻辑。本文将完整拆解大模型应用开发平台技术选型的底层逻辑、决策优先级、全流程步骤与避坑指南,形成一套可直接落地的选型方法论。原创 2026-02-24 09:20:18 · 922 阅读 · 0 评论 -
2026 最新大模型应用开发平台全解析:选型指南与场景适配全攻略
随着大模型应用进入规模化落地阶段,开发平台的选型成为决定项目落地效率、成本与业务效果的核心因素。本文全面梳理了 2026 年大模型应用开发领域的主流平台体系,按开发门槛、部署模式、业务需求与合规要求,划分为 6 大类核心平台,详细拆解了每类平台的核心优势、主流产品、能力边界与适用场景,并给出了全场景快速选型参考。本文适合个人开发者、中小企业技术团队、政企单位技术负责人阅读,可帮助读者快速匹配适配自身需求的大模型应用开发底座,解决选型难、落地慢的行业痛点原创 2026-02-24 09:05:20 · 984 阅读 · 0 评论 -
FP16、FP32、INT8 深度解析:差异、应用场景与工业级落地实践
在深度学习、高性能计算及AI部署领域,FP32(单精度浮点数)、FP16(半精度浮点数)、INT8(8位有符号整数)是最常用的三种数据类型,其核心差异本质是「精度」与「效率」的权衡。多数开发者在项目落地时会困惑:同样是算力载体,三者该如何选型?低精度(FP16/INT8)如何在不损失核心性能的前提下实现加速?本文将从底层原理、核心差异、场景适配、落地案例四个维度,结合代码实操和硬件适配细节,帮你彻底搞懂三者的应用逻辑,贴合工业级落地需求,全程干货无冗余。原创 2026-02-05 16:30:00 · 942 阅读 · 0 评论 -
LoRA微调算力估算全攻略:公式、实战案例与工程技巧
在大模型落地过程中,LoRA(Low-Rank Adaptation)微调因“显存占用低、算力需求小”成为主流方案,但多数工程师仍困惑于“LoRA微调算力如何估算”“不同模型、不同配置下需要多少卡、多久能训完”。本文从LoRA微调的算力核心原理出发,拆解关键影响参数,给出工程化可直接套用的简化公式,搭配4个主流大模型(LLaMA-2-7B/13B/70B、Qwen-14B)的实战案例,涵盖单卡/多卡估算、显存与算力的区别,新手也能快速上手,精准规划LoRA微调的资源与时间成本。原创 2026-02-05 10:15:00 · 920 阅读 · 0 评论 -
主流4 大模型(GPT、LLaMA、DeepSeek、QWE)的训练与推理算力估算实例详细数据
以下选取GPT-3(大参数量通用大模型)、LLaMA-7B(轻量化开源大模型)、DeepSeek-67B(千亿级推理优化大模型)、QWE-13B(自定义中等参数量大模型),分别演示训练和推理场景的算力估算,贴合实际项目场景,参数参考行业常规配置,沿用前文核心公式,确保可复用、可落地。原创 2026-02-04 11:24:47 · 692 阅读 · 0 评论 -
AI项目算力估算全解析:核心因素、关键参数与实操方法
在AI项目落地过程中,算力估算始终是贯穿需求分析、方案设计、资源部署全流程的核心环节——估算不足会导致训练卡顿、推理延迟,无法按时交付;本文将聚焦“AI项目算力如何估算”这一核心问题,拆解算力估算的底层逻辑,详细梳理影响估算结果的关键因素、核心参数,结合实操场景总结估算方法与避坑要点,助力AI工程师、算法工程师快速掌握算力估算技巧,适配不同规模AI项目的资源规划需求。原创 2026-02-04 11:20:22 · 1243 阅读 · 0 评论 -
医疗领域大模型LoRA微调示例数据集
医疗领域大模型LoRA微调示例数据集原创 2026-01-19 10:30:00 · 150 阅读 · 0 评论 -
使用Ollama部署训练后的模型,详细讲解「训练好的 LoRA 模型 + Ollama」完整部署流程
训练完的 LoRA 微调模型,怎么基于 Ollama 部署上线、实际调用、生产可用。 Ollama 是最优解 —— 它是目前部署大模型最简单、最高效、最轻量化的工具,对新手友好、支持 GPU 加速、部署命令极简、还完美兼容我们训练的LoRA 微调模型,完全不用写复杂的部署代码,和LoRA 训练无缝衔接,这也是企业 / 个人落地垂直领域模型的主流组合方案。原创 2026-01-19 09:30:00 · 953 阅读 · 0 评论 -
LoRA 详细解析,使用LoRA 方式对模型进行微调详细操作指南
LoRA(低秩适配)是一种高效的大模型微调技术,通过冻结主模型参数、仅训练插入的小矩阵,实现低成本垂直领域适配。相比全参数微调,LoRA显存需求降低90%,单张消费级显卡即可训练7B模型,产出仅几MB的适配器文件。核心优势包括:保留原模型通用能力、训练速度快、部署灵活(原模型+LoRA文件组合)。实操时99%场景无需编码,使用LLaMAFactory等工具通过配置文件和命令行即可完成,关键步骤是准备高质量的领域数据集(几百条指令-回答对)。该技术已成为医疗、法律等垂直领域微调的首选方案。原创 2026-01-17 21:40:52 · 1221 阅读 · 0 评论 -
训练一个垂直领域大模型,真正训练一个模型,不是只做 RAG,到底要做哪些步骤
摘要:大模型训练与知识库的核心区别在于:训练是通过海量数据调整模型参数使其具备通用能力,而知识库是模型可查询的外部信息库。训练垂直领域大模型的流程包括:1)明确目标范围;2)数据准备(占70%重要性);3)选择基础模型(通常基于已有模型微调);4)训练阶段(继续预训练或指令微调);5)对齐优化(RLHF等);6)专业评估;7)部署监控。整个过程强调数据质量、专业评估和持续更新,训练与知识库相互补充但不可替代。原创 2026-01-17 21:27:16 · 659 阅读 · 0 评论 -
Docker 下安装Weavate向量数据库的详细指南
本文介绍了Weavate向量搜索引擎的部署与优化方法。主要内容包括:1)环境准备与Docker安装;2)单节点容器快速启动和Docker Compose部署;3)持久化数据配置与验证安装;4)高级配置建议,包括缓存优化、负载均衡和数据库连接池设置;5)常见问题排查技巧,涉及性能诊断、日志分析和端口冲突解决等。文章提供了详细的命令行示例和配置片段,帮助用户快速搭建和优化Weavate服务。原创 2026-01-08 14:05:35 · 568 阅读 · 0 评论 -
实现网站扫描公众号二维码进行登录的详细操作指南
微信扫码登录实现方案 摘要:本文详细介绍了基于微信公众号的扫码登录实现方案。系统通过生成带参数的二维码,用户扫码后自动完成身份验证。方案包含前端轮询状态、后端获取微信接口token、处理扫码事件等核心流程。关键技术点包括:1) 使用QR_STR_SCENE生成场景二维码;2) 通过Redis缓存accessToken和登录状态;3) 区分首次关注和已关注用户的处理逻辑。该方案适用于企业内网、电商平台等需要便捷登录的场景,相比传统账号密码方式显著提升用户体验。文中提供了完整的前后端代码示例,包括二维码生成、状原创 2026-01-08 13:07:41 · 1499 阅读 · 0 评论 -
Linux下使用docker安装mysql8.0
本文详细介绍了MySQL 8.0.20 Docker容器的配置流程:首先拉取镜像并启动临时容器,创建挂载目录后拷贝配置文件;然后删除原容器,新增自定义my.cnf配置;接着创建包含端口映射、文件挂载等参数的启动脚本;最后进入容器设置远程访问权限。整个过程涵盖了镜像获取、配置持久化、容器优化和安全设置等关键步骤,为搭建可持久化的MySQL容器环境提供了完整指导。原创 2025-12-19 10:21:26 · 460 阅读 · 0 评论 -
Docker安装MinIO
本文介绍了MinIO这一高性能、开源的分布式对象存储系统及其在Docker环境下的部署方法。MinIO兼容Amazon S3 API,具有轻量级、高可用等特点,适用于云原生存储、大数据分析等场景。文章详细说明了通过Docker安装MinIO的步骤,包括镜像拉取、目录创建、容器启动配置(端口映射、数据卷挂载、认证设置等)以及安装验证。同时介绍了MinIO的基本使用,如创建存储桶、修改权限和常用管理命令,并提供了官方文档参考链接。通过本文,读者可快速掌握MinIO的核心功能与部署方法。原创 2025-12-13 10:47:45 · 806 阅读 · 0 评论 -
Linux和windows下docker环境的安装和使用说明指导
本文详细介绍了Docker容器化平台的安装与配置方法。首先阐述了Docker的概念、优势及其与虚拟机的区别,然后分别讲解了Linux和Windows系统下的安装步骤,包括环境检查、依赖安装等关键环节。文章还提供了Docker常用命令参考,涵盖镜像管理、容器操作、网络配置等内容,并介绍了docker-compose的使用方法。最后针对国内用户提供了配置镜像加速器的解决方案,帮助提高镜像下载速度。本文可作为开发者快速搭建Docker环境的实用指南。原创 2025-12-03 18:06:46 · 974 阅读 · 0 评论
分享