自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2349)
  • 收藏
  • 关注

原创 程序员挣够了钱,到中年失业真的很可怕吗?

最近一刷知乎全部都是大龄程序员失业危机真的有这么可怕吗?程序员35岁就真的到了瓶颈期?我不这么认为挣够了钱,当然不可怕,问题是没挣够啊~!!!按题主的算法是,大城市薪资1w以上,45岁失业,工作20年可以挣够钱:那我们现在来算一下,20年12个月1w=240w没错,这样算下来的确是可以挣到240w左右,但是你还有很多地方需要花钱,如:房租/房贷、孩子学费、赡养老人、家庭日常开支、朋友聚会……等等,这样全部算下来,你觉得你真的挣够钱了吗???而且按照题主说的是45岁失业,但现实是35岁很多程序员

2022-01-05 22:40:31 20159 37

原创 如果一名程序员一个月拿两万,得知一对夫妇卖猪肉可以赚五万一个月后会怎么选择,做程序员还是卖猪肉?

在知乎上看到这么个帖子,觉得挺有意思,大家一起瞧瞧?对此,我也看到了许多犀利的回答哈**A:**我反过来问你,如果一对夫妇卖猪肉一个月只能挣一万,听说一名程序员一个月拿五万,他们能选择去当程序员拿五万吗?这时候你知道不是谁都能当程序员,不是哪个程序员都能拿五万了,那你怎么就觉得谁都能卖猪肉、谁卖猪肉都能赚五万一个月了?你拿得动刀吗?你有超过常人的进货和销售渠道吗?你有人家的口碑吗?**B:**有时候可能会有一些莫名的优越感,将这个世界按照一条线性的赛道来理解,就像从小到大好好学习,一路考大学,唯一的

2022-01-04 21:58:55 16040 32

原创 一天高中的女同桌突然问我是不是程序员,满脸黑人问号?

背景昨天一个我高中的女同桌突然发微信问我“你是不是程序猿 我有问题求助”,先是激动后是茫然再是冷静,毕业多年不见联系,突然发个信息求助,感觉大脑有点反应不过来…再说我一个搞Python的,这点要求大家懂的,人生苦短,我用Python!为了大家的面子,为了程序猿们的脸,不就简单的小Python嘛,必须答应!梳理需求现有excel表格记录着 有效图片的名字,如:要从一个文件夹里把excel表格里记录名字的图片筛选出来;需求也不是很难,代码思路就有了:读取Excel表格第一列的信息并放入

2021-12-30 22:31:31 32091 36

原创 轻量 Agent 框架 Nanobot 教程

Nanobot**是香港大学数据科学实验室(HKUDS)开源的一个项目,号称是 OpenClaw 的精简版实现。**整个框架核心代码只有约 4000 行**,比 OpenClaw 小了 99%,但功能一点都不含糊:工具调用、定时任务、记忆系统、多模型兼容、多平台支持,该有的都有。

2026-05-26 21:22:07 215

原创 为什么你的 RAG 总是“差一点”

很多人第一次做 RAG,都会有一种类似的感受。系统不是不能用。它能答,也经常能答个七七八八。你问公司制度,它能从知识库里捞出几段相关内容;你问产品文档,它也能引用出几个看起来对的片段。表面上,一切都已经跑通了。

2026-05-26 21:20:06 178

原创 用了多语言 embedding,为什么还是查不到?

前端出身,跨进智能体这个坑已经有一段时间了。写这个系列,是想把自己摸索的过程留下来——不是教程,是记录。同在学习路上的,也可以看看我整理的电子书:book.zyh.lol,共勉。

2026-05-26 21:18:14 117

原创 Agent 性能优化实战:延迟、Token、并发三个维度怎么调

你是不是也踩过这种坑:本地测试跑得飞快,上线之后用户说「你这 AI 咋这么慢」;或者月初信心满满上了新功能,月底对账单看到数字翻了三倍,却找不到是哪儿吃掉了那么多 Token?

2026-05-26 21:16:55 187

原创 AI Agent 面试通关18问:从原理到生产的硬核指南

最近一位三年后端转AI方向的朋友,连拿三个Agent岗offer,最高包和最低包差了**40万**。我把他的面经和我收集的大厂真题合在一起,整理出这份面试指南——**18个高频问题,每个都给你最精炼的回答思路**。

2026-05-26 21:13:32 78

原创 从微调到部署一条龙:LLaMA + LoRA + vLLM

想拥有自己的专属 AI 模型,却被动辄数百 GB 的显存需求劝退?

2026-05-25 21:01:56 111

原创 KG基础模型来了!把小型图结构变成结构 Token

大语言模型之所以能在不同任务上表现出很强的迁移能力,一个重要原因是:文本可以被切分成 token。一句话可以拆成词、子词或符号;图像可以被看成像素或图像块。 这些 token 构成了模型能够反复使用的“基础单位”。

2026-05-25 21:00:56 191

原创 LangGraph 循环与重试:为什么你的 Agent 总是陷入死循环?

这篇文章帮你搞定 LangGraph 循环与重试的底层原理,从指数退避到超时控制

2026-05-25 20:59:45 263

原创 高级 RAG(Advanced RAG)详解:让 AI 学会“精准搜索”

在之前的 Naive RAG 阶段,AI 学会了一件事:回答问题前,先去资料库里翻一翻。但很快,人们发现这个“翻一翻”的动作太粗糙了——用户说一句口语,它找不到;用户问一个专业术语,它也找不到。就像一个刚学会用索引卡片的小管理员,稍微复杂一点的查询就束手无策。

2026-05-25 20:58:24 275

原创 字节面试官问:向量数据库到底存什么?

别把向量库答成"存向量":只答这一句最多 50 分,能列出 6 类字段并说清每类对应哪种事故才拿 90 分。这道题考的不是概念,是生产系统判断力。

2026-05-25 20:56:45 328

原创 RAG 文档预处理:从原始文档到高质量知识库

很多团队把 80% 的精力花在调 Embedding 模型、优化 Prompt、换 LLM 上,却忽略了决定 RAG 上限的关键环节——**文档预处理**。分块方式差,再好的检索算法也召回不准;文本没清洗,Embedding 模型产生的向量就是"带噪声"的。本文以 TMC 差旅财务系统为业务背景,系统梳理文档预处理的全流程技术。

2026-05-25 20:55:38 298

原创 Unsloth Studio 实战:可视化微调 Qwen3.5-4B,零代码训练专属小模型

这周我把 Unsloth Studio 这个新工具试了下,结论是:**真的可以零代码跑通一次完整微调**。从加载模型、上传数据集、调超参到导出模型,全在浏览器界面里点。我用 Qwen3.5-4B 跑了一个"客服话术"风格化微调,整个流程不到一小时,显存峰值才 6GB 多一点。

2026-05-25 20:54:00 387

原创 从源码看 RAG:一次请求到底发生了什么?

很多人以为,RAG(检索增强)只是:> “查点资料 + 丢给大模型”但在真实系统中,一次请求远比这复杂。

2026-05-24 10:45:00 338

原创 RAG 进化史:从基础检索到智能体驱动

摘要:本文梳理 RAG 五阶段技术演进——从 Naive RAG 的基础框架到 Agentic RAG 的自主决策,并探讨长上下文窗口时代 RAG 的定位与演进方向。

2026-05-23 20:00:40 363

原创 从 RAG 到 grep:一种更适合 Agent 的检索架构

过去两年,只要提到"大模型接入外部知识",几乎所有系统都会默认走向同一个方案:文档切分 → embedding → 向量数据库 → 相似度召回 → LLM 生成答案

2026-05-22 23:44:32 344

原创 面试官问我:“现在基模能力越来越强,微调(RLHF、SFT)还有价值吗”,我说:“微调还是有意义的,你让我通过面试,入职后慢慢给你讲”

不少录友都听说过“微调”这个词,但没有系统学习过,究竟什么是微调。

2026-05-22 23:43:02 379

原创 智能体元年:一篇讲清楚 Agent 到底是什么?

年初 Openclaw 火出圈,一个开源的多 Agent 协作框架,让几个 AI 同时干活、互相检查。近期,又看到一个 OpenHuman 冒出来,要让 Agent 不只是调 API,而是像人一样操作浏览器、读写文件、跨 App 工作。

2026-05-21 20:30:39 321

原创 RAG知识库构建流程与关键技术

知识库本质上是把企业或个人分散的知识资料进行整理、结构化和存储,让系统能够查得到、找得准、用得上的一种知识管理系统。大模型时代知识库通常会结合`RAG`技术使用,中文通常叫检索增强生成,英文全称是`Retrieval-Augmented Generation`。

2026-05-21 20:29:44 278

原创 GraphRAG也能玩Skill,西交大知识超图起飞

你让一个大模型从医学文献里抽知识图谱,它常常**漏掉关键的时空限定**;换到法律文书,它又开始把一个完整事件拆成**一堆零散的三元组**。换个领域就拉跨,这不是个例,而是现有知识抽取方法的**通病

2026-05-21 20:28:39 364

原创 Agent Harness 解析:智能体架构深度拆解

你搭过一个聊天机器人,接入了ReAct循环,挂了几个工具,演示效果不错。

2026-05-20 20:39:17 401

原创 RAG 正在从“检索增强”走向“知识系统化”

过去一年,RAG 几乎成了大模型应用落地的默认路径:想减少幻觉,用 RAG;想接入私有知识,用 RAG;想做行业问答,也先上 RAG。

2026-05-20 20:38:17 371

原创 一个真正能落地的 Agent 系统,至少要有这 8 个模块

很多人做 Agent 时,第一反应是:换一个更强的大模型、写一个更长的系统提示词、接几个工具。这样当然能做出 Demo,但离“可上线、可维护、可扩展”的系统还差一大截。

2026-05-20 20:37:22 399

原创 RAG我懂你:从架构到知识库构建

传统大语言模型主要依赖参数中的隐式知识进行回答,容易受到知识过期、幻觉和领域知识不足等问题影响。RAG 的核心思想是:在生成答案之前,先从外部知识库中检索相关信息,再将这些信息作为上下文提供给大语言模型,从而提升回答的准确性、可追溯性和时效性。

2026-05-19 21:12:35 309

原创 RAG知识库全流程实操:从分块→检索→生成,逐步拆解

搭了个 RAG,文档灌进去,问题丢过来,回答出来了——看起来能用了。但问它"RAG 四代架构是什么",它编了个"第一代 RTG"——这个术语根本不存在。问它"嵌入模型中文怎么选",它说"建议根据几点来选择"——正确的废话。

2026-05-19 21:11:31 357

原创 主流 RAG 架构与方法总结

文档上传 → 文档解析 → 文本切块 Chunking → Embedding 向量化 → 写入向量库 / 搜索索引 → 用户提问 → 向量检索 Top-K → 拼接上下文 → LLM 生成答案

2026-05-19 21:09:56 374

原创 AI 智能体 8 层架构:生产级系统构建指南

AI 智能体(Agentic AI)革命的关键不在更好的提示词,而在于系统化的架构设计。随着企业竞相部署能够自主感知、推理、规划和行动的 AI 智能体(AI Agent),真正的挑战已经从"我们能构建吗?"转变为"我们能正确构建吗?"

2026-05-19 21:08:42 367

原创 SAGE:四智能体自我进化,让 LLM 从 500 条种子学会推理

本文提出 SAGE,让 Challenger/Planner/Solver/Critic 四智能体共享同一 LLM 骨干闭环共进化,仅用 500 条种子即在 Qwen-2.5-7B 上 LiveCodeBench 提升 8.9%、OlympiadBench 提升 10.7%。

2026-05-18 20:04:32 352

原创 LangGraph 分布式追踪:为什么你的 Agent 执行链总是“黑盒”?

这篇文章帮你搞定 LangGraph 分布式追踪的底层原理,从 Trace/Span 到全链路可观测

2026-05-18 20:03:36 367

原创 Hermes 的核心架构 Harness:上下文、工具、权限与执行控制

上一篇写 Hermes-Agent,我们选了一条比较笨但好用的路:跟一条消息走一遍。从终端里敲下一句话,到 Agent 把最后一个字回到屏幕上,中间其实绕了很长一圈:

2026-05-18 20:02:07 368

原创 大模型推理全链路拆解

从 token 调度到采样输出,追踪每一步张量维度的变化,搞懂 LLM 推理到底在算什么

2026-05-17 20:52:02 339

原创 把文档丢给模型,并不等于做了 RAG,我觉得这个误会太常见了

把文档丢给模型,并不等于做了 RAG,我觉得这个误会太常见了有一次聊天,对方说,他们公司「已经上 RAG 了」。

2026-05-17 20:51:01 319

原创 切实有效的RAG文本分块:语义分割、上下文重叠与评估驱动调优

绝大多数RAG系统的失效,根源都在于糟糕的文本分块。本文将介绍如何合理拆分技术文档,避免检索质量受损。

2026-05-17 20:49:31 335

原创 从零到精通:Hermes Agent 完整上手指南(2026版),Github 9万星的底层解析:记忆、技能、GEPA

这篇可能是全网目之所及,Hermes讲得最透的吧。先假设个时光倒流的场景。

2026-05-17 20:48:14 411

原创 只用文件系统和 Bash,Vercel 做出了一套高效 RAG

不建向量库,也能做 RAG?Vercel 给了一个新答案Vercel 发了一篇博客:Build knowledge agents without embeddings。开源了一个知识库agent问答项目 Knowledge Agent Template。

2026-05-17 20:47:13 235

原创 从手动到自动化:用AgentEval构建Agent评测体系

随着LLM和Agent能力的迅速发展,团队也在不同的场景用Agent做交付,有些场景很依赖基础模型的能力,换个模型可能效果就一落千丈,同样,Agent 改了一版 prompt,线上效果变好了;又改了一版,突然某个场景全崩了。这样的问题我感觉在Agent时代,会非常容易出现,程序里面的逻辑是写死的,一个数据过来,只要符合要求,一定会按照某个逻辑往下走,但是Agent中的逻辑不一样,很多都是通过prompt来约束执行,而LLM的transformer本身就是预测,所以你也不知道下一步应该走向哪里,也许一个tok

2026-05-16 21:33:24 152

原创 上下文无损压缩(LCM)

基于大语言模型(LLM)的智能体系统都有一个共同问题:**上下文窗口是有限的,而真实任务是无限的

2026-05-16 21:32:16 331

原创 大语言模型+agent 赋能AI 科研助手再次进化:从“会聊天”到“会做生物医学分析”

作者提出了一个名为 **BioMedAgent** 的多智能体大语言模型框架。它的目标不是简单回答问题,而是像一名“AI 数据科学家”一样,能够根据自然语言指令,自动规划分析流程、调用生物信息学工具、编写和执行代码,并在完成任务后总结结果。

2026-05-16 21:30:24 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除