自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2167)
  • 收藏
  • 关注

原创 大模型电子书学习推荐 | 这份必读书单请收好,大模型时代,应趁风而起!

今天为你精心整理了一份大模型领域的必读书单,覆盖学习的各个阶段,帮你理清重点,精准锁定最核心、最实用的内容,助你快速突破认知和技术瓶颈。

2025-08-06 11:40:42 765 1

原创 还不知道怎么学大模型?别再闷头瞎学了,看我五分钟,顶你两小时

我虽然没有在大模型的专业领域登峰造极,但也是从零基础一点一点学成的,路上踩过不少坑,中途也划过水,甚至想过放弃,不过最后咬牙坚持了下来,我不敢说自己的建议多专业,只能说接点地气,可操作性强一点。

2025-05-10 16:51:10 1763 1

原创 RAG 效果不好,通常不是模型的问题:4 个关键技术一次讲透

RAG 效果不好,通常不是模型的问题:4 个关键技术一次讲透

2026-05-08 17:45:47 149

原创 LangChain 错误处理:重试机制与异常捕获最佳实践

你有没有遇到过这种情况:本地跑得好好的 LangChain 应用,上线之后突然崩了——API 超时、速率限制、模型输出格式不对……

2026-04-22 14:07:45 379

原创 AI概念扫盲:LLM、Token、MCP、Agent、Skill,一次讲完不再懵

今天我专门花了一天时间,把相关的论文、文档、技术博客、视频都翻了一遍,做了一次系统的学习和梳理。然后想跟大家分享一下我的理解。

2026-04-20 16:01:50 425

原创 一口气搞懂 LLM 大语言模型:AI 最重要的基石

大多数人都有和 DeepSeek、Kimi 这类大语言模型(LLM)对话,却很少有人真正想明白:当你敲下一行文字,点击发送,到模型一字一句吐出回复,这中间到底发生了什么?

2026-04-20 16:01:16 403

原创 35岁程序员转型大模型:靠“技术迁移+经验复用”破局,无需从零内卷

本文专为35岁及以上程序员整理,包含精准转型方向、高适配岗位清单、分阶段学习路径,还有避坑指南,小白也能看懂、程序员可直接落地,建议收藏慢慢看,转型路上少走弯路~

2026-04-17 11:28:21 395

原创 AI Agent 的“记忆革命”来了:真正的分水岭不是模型,而是记忆

昨天你刚跟 AI 聊完半小时项目背景,今天重新打开一个新对话框,它又像第一次见你一样,客客气气地问:“请问你的需求是什么?”

2026-04-14 10:24:50 399

原创 2026年AI Agent的竞争,正在从模型层转移到基础设施层

更好的Agent,不只是更强的推理引擎,而是更好组织的认知系统。 这句话,可能比任何一个基准测试分数都更值得记住。

2026-04-14 10:24:05 487

原创 非专业也能看懂的AI大模型工作原理

本文尽量以非技术的方式来解释 ai 大语言模型的工作原理,以及在工程实践中如何更好的使用。

2026-04-10 11:07:24 189

原创 教你用笔记本部署的大模型,30 分钟搭一个安全又灵活的私有 AI 助手

教你用笔记本部署的大模型,30 分钟搭一个安全又灵活的私有 AI 助手

2026-04-10 11:06:36 418

原创 【转型大模型必看】Java开发者能否转型大模型?程序员的逆袭秘籍,转行不再是梦

今天小编和大家一起来探讨Java开发者是否可以转型到人工智能大模型,转型的优势,薪资对比,以及转型所需的知识和学习路线等。

2026-04-08 10:39:53 365

原创 收藏备用|Java程序员转AI大模型指南:零弯路转型,解锁职场新赛道

作为一名深耕Java领域多年的后端开发者,我经常收到同行的疑问:我们这些长期专注于传统后端开发的人,能否顺利切入大模型领域,搭上这波AI红利快车?

2026-04-08 10:38:27 394

原创 Java开发者转型大模型开发:优势、路径与实践全指南

今天就结合我的转型经验,给各位Java同伴梳理一份易懂、可落地的大模型转型指南,小白也能快速上手,建议收藏备用!

2026-04-08 10:36:56 406

原创 塞巴斯蒂安深度好文:Claude Code、Codex等Coding Agent的架构解析

在这篇文章中,我想讨论Coding Agent和Agent Harness的整体设计:它们是什么,如何工作,以及不同部分如何在实践中结合在一起。

2026-04-07 10:13:17 297

原创 让大模型更好用的三种方法:Prompt、外挂知识库和微调

本文将介绍三种主流并且有效的方法:提示工程(Prompt Engineering)、外挂知识库(Retrieval-Augmented Generation, RAG)和微调(Fine-tuning)。

2026-04-07 10:12:33 221

原创 什么是agent智能体?如何不写代码实现agent?

今年年初deepseek的爆火,将 llm大模型 推出圈,大街小巷没有人不知道deepseek,随后我们便在各大主流app上看到deepseek的身影,搜索、社交、外卖甚至地图。但llm大模型远不止表面。

2026-04-03 11:30:20 364

原创 如何用LangChain开发一个Agent,20分钟包教包会!

26年一定是一个 Agent 大年,我这边持续出系列文章,帮助大家更好的落地 Agent,今天的重点是程序员最常用的 Agent 框架 LangChain。

2026-04-03 11:22:54 297

原创 手把手教你微调 Qwen3.5-2B:从0到1的LoRA实战指南

本文将完整带你走通通义千问3.5-2B模型的LoRA微调全流程,代码可直接复制运行,适合新手入门大模型微调,消费级显卡。

2026-04-01 11:01:07 568

原创 告别大模型幻觉!RAG 原理 + Spring AI 代码实现一步到位

告别大模型幻觉!RAG 原理 + Spring AI 代码实现一步到位

2026-04-01 11:00:24 490

原创 程序员转型AI大模型全攻略:告别焦虑,抢占时代红利

普通程序员该如何判断自己是否要入局?今天就把这些核心问题拆解得明明白白,帮你理清转型思路,少走弯路。

2026-03-31 11:37:25 412

原创 AI浪潮下就业趋势分析与传统程序员转型AI工程师指南

全文融合行业趋势洞察、招聘实战经验与转型落地方法,为AI零基础学习者、传统技术开发者提供清晰的职业方向与可落地的转型步骤,建议收藏反复研读。

2026-03-31 11:35:00 315

原创 收藏!Java程序员必看:AI取代74.5%工作,2026大模型转型才是破局之路

随着AI智能体技术的成熟,“人人都能编程”正在从愿景变成现实,这进一步挤压了初级程序员的生存空间。

2026-03-31 11:33:38 453

原创 带你走进大模型微调技术

大模型微调(Fine-tuning)是指在预训练模型基础上,用特定数据集进一步训练,让模型更贴合具体任务。简言之,预训练模型像一位“通才”,微调则是用专属数据将其训练成适合该特定领域的“专才”。

2026-03-30 10:29:28 393

原创 大模型 API 调用要点整理

LLM API 是将大语言模型能力集成到应用中的标准接口,核心是通过 HTTP 请求发送消息列表、接收模型生成的文本响应。

2026-03-30 10:28:53 436

原创 从零构建企业级 RAG 系统:LangChain + 向量数据库实战

本文将带你从零构建一个生产级的 RAG 系统。

2026-03-30 10:28:15 429

原创 大模型记忆工程:告别“失忆”,构建持续智能的基石

随着大模型与智能体(Agent)技术的飞速发展,我们正从追求单次对话的惊艳表现,迈向构建具备长期、持续交互能力的智能系统。

2026-03-29 08:45:00 262

原创 显存不够?一个开源工具让 12GB 显卡跑 32GB 大模型

RTX 5070 只有 12GB 显存,但有人用一个开源内核模块让它成功跑起了 31.8GB 的大模型。原理很简单:把系统内存和 NVMe 硬盘变成 GPU 的"扩展显存"。

2026-03-28 10:40:52 411

原创 突破瓶颈,从图谱(KG)到高质量问答RAG

本文提出KGQuest框架,创新性地融合模板驱动与LLM精炼两种范式,实现规模化、高质量、确定性的问答生成。

2026-03-28 10:40:13 159

原创 李宏毅老师深度解剖小龙虾:以 OpenClaw 为例介绍 AI Agent 的运作原理

简单说,AI Agent 的本质就是把大模型从“会聊天”升级成“会干活”,而真正的关键在于 Context Engineering。

2026-03-28 10:39:31 313

原创 学了大半年大模型应用开发,整理了这份路线图

# 学了大半年大模型应用开发,整理了这份路线图

2026-03-27 15:26:02 378

原创 不换硬件,速度翻倍:本地 LLM 推理加速实战

不换硬件,速度翻倍:本地 LLM 推理加速实战

2026-03-26 10:42:16 784

原创 Qwen3.5小尺寸模型开源,9B碾压GPT开源版,消费级显卡就能跑

AI圈又出大新闻了✨ 阿里通义千问3.5系列小尺寸模型正式亮相,直接打破“小模型能力弱”的固有认知,甚至实现了“以小胜大”的逆袭,本地部署门槛直接拉到平民级!

2026-03-26 10:40:57 520

原创 Qwen3.5-9B:可以本地跑的小模型,打败了更大的云端模型?

阿里巴巴千问团队于 2026 年 3 月发布了 Qwen3.5 小模型系列(0.8B 到 9B),其中 9B 旗舰在 GPQA Diamond 推理 benchmark 上超越了 OpenAI 的 gpt-oss-120B。

2026-03-26 10:40:20 672

原创 你的AI为什么会“胡说八道“?这项技术正在拯救它

这篇文章将避开晦涩的技术术语,用生活化的类比和实际案例,让非技术背景的读者也能轻松理解。

2026-03-25 15:50:54 369

原创 后端开发Java和大模型应用开发怎么选?

Java 后端这玩意儿,说白了就是工业级老油条的战场,技术成熟,生态庞大,一言不合就是 Spring 全家桶,Redis、MySQL、消息队列、分布式、中间件、容器化、DevOps 一锅炖,你要真想干点活,底子得硬。

2026-03-25 15:50:21 373

原创 国内大厂疯抢大模型人才,大模型人才的春天来了吗?

国内各大互联网公司对高端人才的投入力度非常大,几乎每家公司都有针对顶尖人才的招聘计划,这些计划的特点是“高薪”加“高要求”。

2026-03-25 15:49:36 389

原创 从Java到AI:后端工程师的零成本转型指南

后端岗位早已人满为患,而ai算法岗人才缺口超百万。数据显示,算法工程师平均年薪 35 w,资深者更是突破百万!

2026-03-24 14:45:35 218

原创 Hello-agents 21.9k星智能体开发教程 Datawhale出品 小白友好从零掌握Agent开发

Hello-agents 21.9k星智能体开发教程 Datawhale出品 小白友好从零掌握Agent开发

2026-03-24 14:44:59 368

原创 从零开始训练你的大语言模型:一份完整的实战指南

想要理解 ChatGPT 背后的原理?想亲手训练一个属于自己的大模型?这篇指南将带你走完从数据搜集到模型部署的完整流程。

2026-03-23 15:29:34 427

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除