LLM大模型-CSDN博客

原创大模型电子书学习推荐 | 这份必读书单请收好，大模型时代，应趁风而起！

今天为你精心整理了一份大模型领域的必读书单，覆盖学习的各个阶段，帮你理清重点，精准锁定最核心、最实用的内容，助你快速突破认知和技术瓶颈。

2025-08-06 11:40:42 765 1

原创还不知道怎么学大模型？别再闷头瞎学了，看我五分钟，顶你两小时

我虽然没有在大模型的专业领域登峰造极，但也是从零基础一点一点学成的，路上踩过不少坑，中途也划过水，甚至想过放弃，不过最后咬牙坚持了下来，我不敢说自己的建议多专业，只能说接点地气，可操作性强一点。

2025-05-10 16:51:10 1763 1

原创 RAG 效果不好，通常不是模型的问题：4 个关键技术一次讲透

RAG 效果不好，通常不是模型的问题：4 个关键技术一次讲透

2026-05-08 17:45:47 149

原创 LangChain 错误处理：重试机制与异常捕获最佳实践

你有没有遇到过这种情况：本地跑得好好的 LangChain 应用，上线之后突然崩了——API 超时、速率限制、模型输出格式不对……

2026-04-22 14:07:45 379

原创 AI概念扫盲：LLM、Token、MCP、Agent、Skill，一次讲完不再懵

今天我专门花了一天时间，把相关的论文、文档、技术博客、视频都翻了一遍，做了一次系统的学习和梳理。然后想跟大家分享一下我的理解。

2026-04-20 16:01:50 425

原创一口气搞懂 LLM 大语言模型：AI 最重要的基石

大多数人都有和 DeepSeek、Kimi 这类大语言模型（LLM）对话，却很少有人真正想明白：当你敲下一行文字，点击发送，到模型一字一句吐出回复，这中间到底发生了什么？

2026-04-20 16:01:16 403

原创 35岁程序员转型大模型：靠“技术迁移+经验复用”破局，无需从零内卷

本文专为35岁及以上程序员整理，包含精准转型方向、高适配岗位清单、分阶段学习路径，还有避坑指南，小白也能看懂、程序员可直接落地，建议收藏慢慢看，转型路上少走弯路～

2026-04-17 11:28:21 395

原创 AI Agent 的“记忆革命”来了：真正的分水岭不是模型，而是记忆

昨天你刚跟 AI 聊完半小时项目背景，今天重新打开一个新对话框，它又像第一次见你一样，客客气气地问：“请问你的需求是什么？”

2026-04-14 10:24:50 399

原创 2026年AI Agent的竞争，正在从模型层转移到基础设施层

更好的Agent，不只是更强的推理引擎，而是更好组织的认知系统。这句话，可能比任何一个基准测试分数都更值得记住。

2026-04-14 10:24:05 487

原创非专业也能看懂的AI大模型工作原理

本文尽量以非技术的方式来解释 ai 大语言模型的工作原理，以及在工程实践中如何更好的使用。

2026-04-10 11:07:24 189

原创教你用笔记本部署的大模型，30 分钟搭一个安全又灵活的私有 AI 助手

教你用笔记本部署的大模型，30 分钟搭一个安全又灵活的私有 AI 助手

2026-04-10 11:06:36 418

原创【转型大模型必看】Java开发者能否转型大模型？程序员的逆袭秘籍，转行不再是梦

今天小编和大家一起来探讨Java开发者是否可以转型到人工智能大模型，转型的优势，薪资对比，以及转型所需的知识和学习路线等。

2026-04-08 10:39:53 365

原创收藏备用｜Java程序员转AI大模型指南：零弯路转型，解锁职场新赛道

作为一名深耕Java领域多年的后端开发者，我经常收到同行的疑问：我们这些长期专注于传统后端开发的人，能否顺利切入大模型领域，搭上这波AI红利快车？

2026-04-08 10:38:27 394

原创 Java开发者转型大模型开发：优势、路径与实践全指南

今天就结合我的转型经验，给各位Java同伴梳理一份易懂、可落地的大模型转型指南，小白也能快速上手，建议收藏备用！

2026-04-08 10:36:56 406

原创塞巴斯蒂安深度好文：Claude Code、Codex等Coding Agent的架构解析

在这篇文章中，我想讨论Coding Agent和Agent Harness的整体设计：它们是什么，如何工作，以及不同部分如何在实践中结合在一起。

2026-04-07 10:13:17 297

原创让大模型更好用的三种方法：Prompt、外挂知识库和微调

本文将介绍三种主流并且有效的方法：提示工程（Prompt Engineering）、外挂知识库（Retrieval-Augmented Generation, RAG）和微调（Fine-tuning）。

2026-04-07 10:12:33 221

原创什么是agent智能体？如何不写代码实现agent？

今年年初deepseek的爆火，将 llm大模型推出圈，大街小巷没有人不知道deepseek，随后我们便在各大主流app上看到deepseek的身影，搜索、社交、外卖甚至地图。但llm大模型远不止表面。

2026-04-03 11:30:20 364

原创如何用LangChain开发一个Agent，20分钟包教包会！

26年一定是一个 Agent 大年，我这边持续出系列文章，帮助大家更好的落地 Agent，今天的重点是程序员最常用的 Agent 框架 LangChain。

2026-04-03 11:22:54 297

原创手把手教你微调 Qwen3.5-2B：从0到1的LoRA实战指南

本文将完整带你走通通义千问3.5-2B模型的LoRA微调全流程，代码可直接复制运行，适合新手入门大模型微调，消费级显卡。

2026-04-01 11:01:07 568

原创告别大模型幻觉！RAG 原理 + Spring AI 代码实现一步到位

告别大模型幻觉！RAG 原理 + Spring AI 代码实现一步到位

2026-04-01 11:00:24 490

原创程序员转型AI大模型全攻略：告别焦虑，抢占时代红利

普通程序员该如何判断自己是否要入局？今天就把这些核心问题拆解得明明白白，帮你理清转型思路，少走弯路。

2026-03-31 11:37:25 412

原创 AI浪潮下就业趋势分析与传统程序员转型AI工程师指南

全文融合行业趋势洞察、招聘实战经验与转型落地方法，为AI零基础学习者、传统技术开发者提供清晰的职业方向与可落地的转型步骤，建议收藏反复研读。

2026-03-31 11:35:00 315

原创收藏！Java程序员必看：AI取代74.5%工作，2026大模型转型才是破局之路

随着AI智能体技术的成熟，“人人都能编程”正在从愿景变成现实，这进一步挤压了初级程序员的生存空间。

2026-03-31 11:33:38 453

原创带你走进大模型微调技术

大模型微调（Fine-tuning）是指在预训练模型基础上，用特定数据集进一步训练，让模型更贴合具体任务。简言之，预训练模型像一位“通才”，微调则是用专属数据将其训练成适合该特定领域的“专才”。

2026-03-30 10:29:28 393

原创大模型 API 调用要点整理

LLM API 是将大语言模型能力集成到应用中的标准接口，核心是通过 HTTP 请求发送消息列表、接收模型生成的文本响应。

2026-03-30 10:28:53 436

原创从零构建企业级 RAG 系统：LangChain + 向量数据库实战

本文将带你从零构建一个生产级的 RAG 系统。

2026-03-30 10:28:15 429

原创大模型记忆工程：告别“失忆”，构建持续智能的基石

随着大模型与智能体（Agent）技术的飞速发展，我们正从追求单次对话的惊艳表现，迈向构建具备长期、持续交互能力的智能系统。

2026-03-29 08:45:00 262

原创显存不够？一个开源工具让 12GB 显卡跑 32GB 大模型

RTX 5070 只有 12GB 显存，但有人用一个开源内核模块让它成功跑起了 31.8GB 的大模型。原理很简单：把系统内存和 NVMe 硬盘变成 GPU 的"扩展显存"。

2026-03-28 10:40:52 411

原创突破瓶颈，从图谱(KG)到高质量问答RAG

本文提出KGQuest框架，创新性地融合模板驱动与LLM精炼两种范式，实现规模化、高质量、确定性的问答生成。

2026-03-28 10:40:13 159

原创李宏毅老师深度解剖小龙虾：以 OpenClaw 为例介绍 AI Agent 的运作原理

简单说，AI Agent 的本质就是把大模型从“会聊天”升级成“会干活”，而真正的关键在于 Context Engineering。

2026-03-28 10:39:31 313

原创学了大半年大模型应用开发，整理了这份路线图

# 学了大半年大模型应用开发，整理了这份路线图

2026-03-27 15:26:02 378

原创不换硬件，速度翻倍：本地 LLM 推理加速实战

不换硬件，速度翻倍：本地 LLM 推理加速实战

2026-03-26 10:42:16 784

原创 Qwen3.5小尺寸模型开源，9B碾压GPT开源版，消费级显卡就能跑

AI圈又出大新闻了✨ 阿里通义千问3.5系列小尺寸模型正式亮相，直接打破“小模型能力弱”的固有认知，甚至实现了“以小胜大”的逆袭，本地部署门槛直接拉到平民级！

2026-03-26 10:40:57 520

原创 Qwen3.5-9B：可以本地跑的小模型，打败了更大的云端模型？

阿里巴巴千问团队于 2026 年 3 月发布了 Qwen3.5 小模型系列（0.8B 到 9B），其中 9B 旗舰在 GPQA Diamond 推理 benchmark 上超越了 OpenAI 的 gpt-oss-120B。

2026-03-26 10:40:20 672

原创你的AI为什么会“胡说八道“？这项技术正在拯救它

这篇文章将避开晦涩的技术术语，用生活化的类比和实际案例，让非技术背景的读者也能轻松理解。

2026-03-25 15:50:54 369

原创后端开发Java和大模型应用开发怎么选？

Java 后端这玩意儿，说白了就是工业级老油条的战场，技术成熟，生态庞大，一言不合就是 Spring 全家桶，Redis、MySQL、消息队列、分布式、中间件、容器化、DevOps 一锅炖，你要真想干点活，底子得硬。

2026-03-25 15:50:21 373

原创国内大厂疯抢大模型人才，大模型人才的春天来了吗？

国内各大互联网公司对高端人才的投入力度非常大，几乎每家公司都有针对顶尖人才的招聘计划，这些计划的特点是“高薪”加“高要求”。

2026-03-25 15:49:36 389

原创从Java到AI：后端工程师的零成本转型指南

后端岗位早已人满为患，而ai算法岗人才缺口超百万。数据显示，算法工程师平均年薪 35 w，资深者更是突破百万！

2026-03-24 14:45:35 218

原创 Hello-agents 21.9k星智能体开发教程 Datawhale出品小白友好从零掌握Agent开发

Hello-agents 21.9k星智能体开发教程 Datawhale出品小白友好从零掌握Agent开发

2026-03-24 14:44:59 368

原创从零开始训练你的大语言模型：一份完整的实战指南

想要理解 ChatGPT 背后的原理？想亲手训练一个属于自己的大模型？这篇指南将带你走完从数据搜集到模型部署的完整流程。

2026-03-23 15:29:34 427

空空如也

空空如也