- 博客(1862)
- 收藏
- 关注
原创 3090 本地跑 Qwen 3.6 27B:踩完所有坑后的完整部署方案
本文从实测踩坑视角出发,记录 RTX 3090 24GB 跑 Qwen 3.6 27B 的完整过程——哪些方案失败了、唯一跑通的路是什么。
2026-05-08 17:44:36
1413
原创 知识图谱入门到实战:程序员构建 RAG 应用的核心技术指南
知识图谱如何提升大模型 RAG 应用效果?本文从面试场景切入,详解知识图谱核心原理、Neo4j 选型、构建方法及避坑指南,助力开发者打造更智能的 AI 应用。
2026-04-22 14:06:46
495
原创 基于 LangGraph + Agentic RAG,我写了一个智能客服 Agent 后端原型
今天给大家推荐一款刚刚做的后端 Agent 原型项目 —— Support-Copilot。它刻意剥离了繁琐的前端,直击 AI 业务落地的核心:Agentic RAG 与 LangGraph 智能分诊。
2026-04-20 15:59:51
441
原创 RAG 为什么总是答非所问?三个方向帮你提升准确率
搭过 RAG 系统的人大概都经历过这个时刻:以为终于做出来了,上线一测,准确率 60%。用户问东,系统答西,还答得特别自信。
2026-04-20 15:59:03
392
原创 2026年程序员转型AI大模型:百万年薪不再靠熬资历,而是这三大核心能力!
2025年底,大模型算法工程师岗位月薪中位数已达到2.47万元,领跑所有AI技术岗位。这仅仅是起步薪资。
2026-04-17 11:26:30
313
原创 LLM会用工具,不等于真正会干活:哈工大最新综述把 AI Agent 讲透了
很多人一提到 Agent,第一反应就是:给大模型接上搜索、数据库、浏览器、代码解释器,再加几个 API,它不就能自己干活了吗?
2026-04-14 10:23:16
191
原创 Agent为何“越跑越贵”?STEP-HRL引入层级强化学习,让大模型Agent瘦身又增效
在人工智能的竞技场上,大语言模型(LLM)驱动的智能体(Agent)正被寄予厚望。从自动订票到辅助科研,我们希望它们能像人类一样,在复杂、多步骤的环境中自主决策。
2026-04-14 10:22:34
408
原创 Ollama + OpenClaw:让本地模型变成 24 小时 AI 助手
今天这篇,我要把它升级成真正的 Agent:能定时执行任务、能主动推送消息、能自动化处理工作流,而且所有数据都留在本地。
2026-04-10 11:04:30
432
原创 每天15分钟 15 天带你学会 AI 智能体开发(四):RAG 进阶——从 chunk 策略到检索优化
上一篇我们跑通了一个最小 RAG:文档入库 → 向量搜索 → 喂给模型 → 得到回答。能用了,但离"好用"还差得远。
2026-04-08 11:45:00
420
原创 每天15分钟 15 天带你学会 AI 智能体开发(三):RAG 让你的 bot 知道它“本来不知道的事“
上一篇我们给 bot 装了 Memory,它终于能记住"刚聊过什么"。但还有一类问题它照样答不上来:你公司的事、你电脑里的文档、你脑子里的业务知识——它全不知道。
2026-04-08 08:00:00
460
原创 每天15分钟 15 天带你学会 AI 智能体开发(二):Memory 让对话“活起来“
上一篇我们做了一个能回答问题的 bot,但有个致命问题:它不记得你刚刚说了什么。这一篇,我们把它升级成一个"有记忆"的对话助手。
2026-04-07 10:10:02
255
原创 每天15分钟 15 天带你学会 AI 智能体开发(一):LangChain 入门
我看过很多 LangChain 教程,大多数上来就是"什么是 Agent""什么是 RAG",看完脑子里全是词,手上什么都没有。
2026-04-07 10:09:33
406
原创 让天才 AI 绝对听话:一文看懂 RAG 怎么防止幻觉
调用本地轻量级模型进行初步信息提纯,剔除冗余修辞与无关片段。将浓缩后的核心干货再交给主力大模型进行最终解答,既提效降本,又保证了关键信息的命中率。
2026-04-03 11:12:28
250
原创 大模型之Function Calling
大模型本身不太擅长实时信息(比如“现在几点”)、精准计算(比如复杂数学题)这类任务,但Function Calling相当于给它开了个“外挂”:通过调用对应的外部工具(查时间的工具、计算器工具),就能让大模型把这些原本搞不定的问题给解决了。
2026-04-01 10:59:27
425
原创 大模型预训练与微调核心概念详解
预训练(Pre-training) 是大模型在大规模通用数据集上进行的初始训练阶段。目标是让模型学习语言的基本结构、常识知识、语法、语义关系等通用能力,而不是针对某个特定任务。
2026-04-01 10:58:56
412
原创 收藏备用|程序员转型AI大模型:8大热门岗位+转行全攻略(小白必看)
本文专为程序员群体整理,详细拆解转型AI大模型的8大热门岗位,搭配从基础入门到项目落地的完整转行步骤,同时揭秘国内大模型人才缺口现状——2026年行业仍存在巨大职业红利,还附上可直接套用的系统学习资源。
2026-03-31 11:28:17
485
原创 从RAG到Agentic RAG 的进化之路
Agentic RAG就是基于RAG检索+生成的基本模式,加入了Agent的各种能力:计划,编排,工具调用等等。
2026-03-30 10:26:13
234
原创 百度大模型二面:有微调过 Agent 能力吗?数据集如何收集?
大部分人停留在 Prompt + 闭源 API 的阶段就基本上交差了,只有当你真的需要在开源模型上把 Agent 跑起来、或者对工具调用的稳定性有极致要求时,才会走到微调这一步。
2026-03-30 10:25:35
387
原创 阿里开源Qwen3.5:你的电脑也能跑顶级AI了
就在最近,阿里巴巴放了一个大招——开源了全新的Qwen3.5模型系列。这不仅仅是又一个"国产大模型"那么简单,而是真正让普通用户能在自己电脑上运行顶级AI的可能性。
2026-03-30 10:24:37
902
原创 RAG 的四大核心原理:从“闭卷考试”到“开卷作弊”的进化之路
RAG(检索增强生成)就是把大模型从“闭卷考试”强行拉到了“开卷考场”,并给了它一本实时更新的“参考书”。
2026-03-29 10:30:00
243
原创 李宏毅老师讲解AI Agent的核心技术:Context Engineering
整体来看,这一讲的核心结论是:AI Agent 时代,比拼的不只是模型本身,而是上下文管理、任务组织和人类设定目标与边界的能力。
2026-03-28 10:38:06
254
原创 开源了!1+1>2:顶级RAG检索器原来是这样协同工作的
这篇论文提出了MIGRASCOPE框架,首次从信息论角度系统评估RAG检索器,解决了传统评估指标无法捕捉检索器间互补性和冗余性的痛点。
2026-03-28 10:37:12
249
原创 谷歌新发现:让LLM“听懂“问题的实用技巧
大语言模型通常作为因果语言模型训练,这意味着过去的token不能关注未来的token。这种单向注意力机制导致查询中token的顺序会影响预测性能。
2026-03-28 10:36:31
210
原创 下一代RAG来了!腾讯&港大ACQO自适应复杂查询优化,引爆行业新标准
腾讯优图&港大&南大联合提出ACQO框架,用两阶段强化学习教会LLM“何时拆、怎么合”,在TopiOCQA、HotpotQA等三大复杂Query基准上刷新SOTA,推理速度提升9倍,无需人工标注即可上线。
2026-03-27 15:17:44
367
原创 图解 Prompt Engineering 提示词工程:从瞎问到系统化设计
本篇覆盖 Zero-shot/Few-shot 学习、Chain of Thought(思维链)推理、System/User/Assistant 角色设计、Temperature/Top-p 参数调优 等核心技术。
2026-03-27 15:17:01
431
原创 LangGraph 实战指南:从零构建一个会“思考”的 AI 智能体
过去两年,从智能客服到自动化助手,从语音机器人到内部流程自动化,几乎所有我构建的、需要“思考”的 AI 应用,核心都离不开 LangGraph。它不仅是我个人实验项目的首选,更频繁出现在客户的生产系统中。
2026-03-26 10:37:54
423
原创 LangChain与Ollama本地大语言模型的RAG私有知识库构建:融合向量数据库与多源文档查询
LangChain 1.0来了!作为当前最火热的AI应用开发框架,它提供了一套标准化的组件,让你像搭积木一样快速搭建复杂的LLM工作流(点击文末“阅读原文”获取完整智能体、代码、数据、文档)。
2026-03-26 10:37:04
425
原创 2026年构建RAG系统的核心策略:从60%到94%准确率
本文将带你了解11个先进的RAG策略,它们将我的系统准确率从60%提升到了94%,并详细展示如何组合这些策略以实现最大效果。
2026-03-26 10:36:05
409
原创 超越单体模型:Anthropic多智能体协作系统的技术架构与智能涌现逻辑
Anthropic提出的“多智能体协作系统”(Multi-Agent Collaborative System, MACS)通过分布式智能体协同突破这一瓶颈,其技术设计直指可扩展性、动态知识融合与可控对齐三大核心问题。
2026-03-25 15:48:07
436
原创 大模型微调(一)为什么要模型微调?
「微调」 是利用预训练LLM并训练至少一个内部参数(即权重),通常是使用预训练好的通用基础模型(例如GPT-3)转换为特定用例(例如 ChatGPT)的专用模型。
2026-03-25 15:47:10
378
原创 大模型面试:RAG项目的拷问(文字版)
在运行时,会使用相同的向量来对用户的查询进行处理,然后执行向量搜索,在向量数据库中检索到最匹配的结果,并将这些结果作为上下文输入到大模型的提示词中,以生成总结性的答案。
2026-03-25 15:46:27
368
原创 LangChain入门教程01: 从稳定的模型调用开始
LangChain 官方文档里也把 chat model 作为核心入口来讲,init_chat_model 的输入是 messages,输出也是 messages。这个认知很重要,后面很多能力都建立在这里。
2026-03-24 14:41:27
422
原创 动手学习大模型-概述篇
本文作为整个系列的开篇,先带大家过一遍大模型领域的主体知识,同时规划后续的详细学习计划。在阅读过程中遇到不理解的地方不必纠结,在后续实践课程中遇到了会有详细的解释。
2026-03-23 15:23:05
499
原创 让大模型读懂你的私有文档:一文讲透 RAG 检索增强生成与Agent智能体落地
在用户提问时,系统先去私有知识库中搜索相关片段,将这些片段作为“上下文”连同问题一起喂给大模型。这样,大模型就能基于事实回答问题,极大地减少了幻觉,提升了专业度。
2026-03-23 15:22:05
353
原创 Java开发者转AI开发指南:60%已转型,薪资翻倍的秘密
AI不是替代程序员,而是放大其价值,传统Java开发者应抓住这一机遇,将传统开发能力与AI技术结合,创造更大价值。转型窗口期正在缩小,行动者才能成为受益者。
2026-03-22 10:30:00
339
原创 【附学习路线】AI产品经理零基础入门指南,程序员转型高薪必学
现在市场上AI产品经理的需求远大于供给!这对于想要转型 AI 产品经理的人来说,无疑是一个巨大的机会!
2026-03-22 07:45:00
372
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅