- 博客(2167)
- 收藏
- 关注
原创 大模型电子书学习推荐 | 这份必读书单请收好,大模型时代,应趁风而起!
今天为你精心整理了一份大模型领域的必读书单,覆盖学习的各个阶段,帮你理清重点,精准锁定最核心、最实用的内容,助你快速突破认知和技术瓶颈。
2025-08-06 11:40:42
765
1
原创 还不知道怎么学大模型?别再闷头瞎学了,看我五分钟,顶你两小时
我虽然没有在大模型的专业领域登峰造极,但也是从零基础一点一点学成的,路上踩过不少坑,中途也划过水,甚至想过放弃,不过最后咬牙坚持了下来,我不敢说自己的建议多专业,只能说接点地气,可操作性强一点。
2025-05-10 16:51:10
1763
1
原创 LangChain 错误处理:重试机制与异常捕获最佳实践
你有没有遇到过这种情况:本地跑得好好的 LangChain 应用,上线之后突然崩了——API 超时、速率限制、模型输出格式不对……
2026-04-22 14:07:45
379
原创 AI概念扫盲:LLM、Token、MCP、Agent、Skill,一次讲完不再懵
今天我专门花了一天时间,把相关的论文、文档、技术博客、视频都翻了一遍,做了一次系统的学习和梳理。然后想跟大家分享一下我的理解。
2026-04-20 16:01:50
425
原创 一口气搞懂 LLM 大语言模型:AI 最重要的基石
大多数人都有和 DeepSeek、Kimi 这类大语言模型(LLM)对话,却很少有人真正想明白:当你敲下一行文字,点击发送,到模型一字一句吐出回复,这中间到底发生了什么?
2026-04-20 16:01:16
403
原创 35岁程序员转型大模型:靠“技术迁移+经验复用”破局,无需从零内卷
本文专为35岁及以上程序员整理,包含精准转型方向、高适配岗位清单、分阶段学习路径,还有避坑指南,小白也能看懂、程序员可直接落地,建议收藏慢慢看,转型路上少走弯路~
2026-04-17 11:28:21
395
原创 AI Agent 的“记忆革命”来了:真正的分水岭不是模型,而是记忆
昨天你刚跟 AI 聊完半小时项目背景,今天重新打开一个新对话框,它又像第一次见你一样,客客气气地问:“请问你的需求是什么?”
2026-04-14 10:24:50
399
原创 2026年AI Agent的竞争,正在从模型层转移到基础设施层
更好的Agent,不只是更强的推理引擎,而是更好组织的认知系统。 这句话,可能比任何一个基准测试分数都更值得记住。
2026-04-14 10:24:05
487
原创 【转型大模型必看】Java开发者能否转型大模型?程序员的逆袭秘籍,转行不再是梦
今天小编和大家一起来探讨Java开发者是否可以转型到人工智能大模型,转型的优势,薪资对比,以及转型所需的知识和学习路线等。
2026-04-08 10:39:53
365
原创 收藏备用|Java程序员转AI大模型指南:零弯路转型,解锁职场新赛道
作为一名深耕Java领域多年的后端开发者,我经常收到同行的疑问:我们这些长期专注于传统后端开发的人,能否顺利切入大模型领域,搭上这波AI红利快车?
2026-04-08 10:38:27
394
原创 Java开发者转型大模型开发:优势、路径与实践全指南
今天就结合我的转型经验,给各位Java同伴梳理一份易懂、可落地的大模型转型指南,小白也能快速上手,建议收藏备用!
2026-04-08 10:36:56
406
原创 塞巴斯蒂安深度好文:Claude Code、Codex等Coding Agent的架构解析
在这篇文章中,我想讨论Coding Agent和Agent Harness的整体设计:它们是什么,如何工作,以及不同部分如何在实践中结合在一起。
2026-04-07 10:13:17
297
原创 让大模型更好用的三种方法:Prompt、外挂知识库和微调
本文将介绍三种主流并且有效的方法:提示工程(Prompt Engineering)、外挂知识库(Retrieval-Augmented Generation, RAG)和微调(Fine-tuning)。
2026-04-07 10:12:33
221
原创 什么是agent智能体?如何不写代码实现agent?
今年年初deepseek的爆火,将 llm大模型 推出圈,大街小巷没有人不知道deepseek,随后我们便在各大主流app上看到deepseek的身影,搜索、社交、外卖甚至地图。但llm大模型远不止表面。
2026-04-03 11:30:20
364
原创 如何用LangChain开发一个Agent,20分钟包教包会!
26年一定是一个 Agent 大年,我这边持续出系列文章,帮助大家更好的落地 Agent,今天的重点是程序员最常用的 Agent 框架 LangChain。
2026-04-03 11:22:54
297
原创 手把手教你微调 Qwen3.5-2B:从0到1的LoRA实战指南
本文将完整带你走通通义千问3.5-2B模型的LoRA微调全流程,代码可直接复制运行,适合新手入门大模型微调,消费级显卡。
2026-04-01 11:01:07
568
原创 程序员转型AI大模型全攻略:告别焦虑,抢占时代红利
普通程序员该如何判断自己是否要入局?今天就把这些核心问题拆解得明明白白,帮你理清转型思路,少走弯路。
2026-03-31 11:37:25
412
原创 AI浪潮下就业趋势分析与传统程序员转型AI工程师指南
全文融合行业趋势洞察、招聘实战经验与转型落地方法,为AI零基础学习者、传统技术开发者提供清晰的职业方向与可落地的转型步骤,建议收藏反复研读。
2026-03-31 11:35:00
315
原创 收藏!Java程序员必看:AI取代74.5%工作,2026大模型转型才是破局之路
随着AI智能体技术的成熟,“人人都能编程”正在从愿景变成现实,这进一步挤压了初级程序员的生存空间。
2026-03-31 11:33:38
453
原创 带你走进大模型微调技术
大模型微调(Fine-tuning)是指在预训练模型基础上,用特定数据集进一步训练,让模型更贴合具体任务。简言之,预训练模型像一位“通才”,微调则是用专属数据将其训练成适合该特定领域的“专才”。
2026-03-30 10:29:28
393
原创 大模型 API 调用要点整理
LLM API 是将大语言模型能力集成到应用中的标准接口,核心是通过 HTTP 请求发送消息列表、接收模型生成的文本响应。
2026-03-30 10:28:53
436
原创 大模型记忆工程:告别“失忆”,构建持续智能的基石
随着大模型与智能体(Agent)技术的飞速发展,我们正从追求单次对话的惊艳表现,迈向构建具备长期、持续交互能力的智能系统。
2026-03-29 08:45:00
262
原创 显存不够?一个开源工具让 12GB 显卡跑 32GB 大模型
RTX 5070 只有 12GB 显存,但有人用一个开源内核模块让它成功跑起了 31.8GB 的大模型。原理很简单:把系统内存和 NVMe 硬盘变成 GPU 的"扩展显存"。
2026-03-28 10:40:52
411
原创 突破瓶颈,从图谱(KG)到高质量问答RAG
本文提出KGQuest框架,创新性地融合模板驱动与LLM精炼两种范式,实现规模化、高质量、确定性的问答生成。
2026-03-28 10:40:13
159
原创 李宏毅老师深度解剖小龙虾:以 OpenClaw 为例介绍 AI Agent 的运作原理
简单说,AI Agent 的本质就是把大模型从“会聊天”升级成“会干活”,而真正的关键在于 Context Engineering。
2026-03-28 10:39:31
313
原创 Qwen3.5小尺寸模型开源,9B碾压GPT开源版,消费级显卡就能跑
AI圈又出大新闻了✨ 阿里通义千问3.5系列小尺寸模型正式亮相,直接打破“小模型能力弱”的固有认知,甚至实现了“以小胜大”的逆袭,本地部署门槛直接拉到平民级!
2026-03-26 10:40:57
520
原创 Qwen3.5-9B:可以本地跑的小模型,打败了更大的云端模型?
阿里巴巴千问团队于 2026 年 3 月发布了 Qwen3.5 小模型系列(0.8B 到 9B),其中 9B 旗舰在 GPQA Diamond 推理 benchmark 上超越了 OpenAI 的 gpt-oss-120B。
2026-03-26 10:40:20
672
原创 后端开发Java和大模型应用开发怎么选?
Java 后端这玩意儿,说白了就是工业级老油条的战场,技术成熟,生态庞大,一言不合就是 Spring 全家桶,Redis、MySQL、消息队列、分布式、中间件、容器化、DevOps 一锅炖,你要真想干点活,底子得硬。
2026-03-25 15:50:21
373
原创 国内大厂疯抢大模型人才,大模型人才的春天来了吗?
国内各大互联网公司对高端人才的投入力度非常大,几乎每家公司都有针对顶尖人才的招聘计划,这些计划的特点是“高薪”加“高要求”。
2026-03-25 15:49:36
389
原创 从Java到AI:后端工程师的零成本转型指南
后端岗位早已人满为患,而ai算法岗人才缺口超百万。数据显示,算法工程师平均年薪 35 w,资深者更是突破百万!
2026-03-24 14:45:35
218
原创 Hello-agents 21.9k星智能体开发教程 Datawhale出品 小白友好从零掌握Agent开发
Hello-agents 21.9k星智能体开发教程 Datawhale出品 小白友好从零掌握Agent开发
2026-03-24 14:44:59
368
原创 从零开始训练你的大语言模型:一份完整的实战指南
想要理解 ChatGPT 背后的原理?想亲手训练一个属于自己的大模型?这篇指南将带你走完从数据搜集到模型部署的完整流程。
2026-03-23 15:29:34
427
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅