92year-CSDN博客

原创 Context Engineering实战：4个文件让AI编程助手真正读懂你的项目

但用了三个月后，你会发现一个反复出现的问题：AI生成的代码不遵守你的项目规范。它不知道你上季度把REST换成了GraphQL，不知道你废弃了那个认证库，也不知道你的架构师刻意把每个服务控制在500行以内。Phil Schmid在2025年中说过：这是"在正确的时间，以正确的格式，给模型正确的信息和工具"。你的项目规范、架构决策、踩过的坑，它一概不知。Packmind今年1月的调查：91%的工程团队用了至少一种AI编程工具，但在同时用6个以上工具的团队里，只有28%的人对代码质量有信心。

2026-06-18 11:08:16 247

原创 Zvec v0.5.0实战：不用部署服务，Python几行代码搞定向量检索+全文搜索

Zvec v0.5.0加了全文检索和混合检索之后，嵌入式向量数据库该有的功能基本齐了。个人项目、本地RAG、边缘部署，pip install完就能跑，不用折腾Docker和服务配置，省心不少。DiskANN索引让它能处理更大规模的数据而不吃太多内存，不再只能当原型验证的工具了。代码仓库：https://github.com/alibaba/zvec文档：https://zvec.org。

2026-06-17 11:08:28 274

原创 MIT追踪10万开发者：AI让代码量翻了17倍，但交付只多了30%

MIT这项研究让我想到了一个比喻：AI编程工具像是给了每个人一台高速打印机，但从打印到出版之间还差了编辑、排版、审校、发行的距离。打印机再快，不解决后面的环节，书架上不会凭空多出好书来。论文链接：https://www.nber.org/papers/w35275。

2026-06-16 10:47:15 270

原创 Claude Code Hooks 实战：6个配置让你的AI编程助手不再“自由发挥“

用过 Claude Code 的人都知道一个问题：你告诉它"每次改完文件跑一下 Prettier"，它有时候会照做，有时候会忘。你说"别动我的 .env 文件"，它多数时候会听，但偶尔还是会手贱改一下。这不是 Claude Code 的 bug，是大语言模型的本质——概率性输出。你用自然语言下的指令，它不保证每次都执行。Hooks 就是来解决这个问题的。它是 Claude Code 的生命周期脚本机制，在特定时机自动触发 shell 命令，跟 Git Hooks 一个道理。

2026-06-14 11:07:15 328

原创 Firecrawl /monitor 实战：网页一变，Agent 就动

你的 AI Agent 怎么知道某个网页更新了？最笨的办法是轮询：每隔几分钟抓一遍页面，拿新内容和旧内容做 diff。这事不难，但烦——得自己写 cron、存快照、处理 diff、搭 webhook、过滤噪音（广告、时间戳、session token 之类的变化全得跳过）。搞一个页面还行，监控几十个页面就变成了运维噩梦。Firecrawl 5月底上线了/monitor端点，把这套流程打包成了一个 API 调用。我花了两天把它接进自己的 Agent 工作流里，记录一下踩坑过程。

2026-06-13 11:08:34 220

原创 Miasma蠕虫实战复盘：你clone的仓库正在偷你的云凭证

上周五（6月5日），微软在GitHub上的73个仓库被一次性禁用。原因不是误操作，是一个叫Miasma的蠕虫在105秒内感染了Azure、Azure-Samples、Microsoft、MicrosoftDocs四个组织下的仓库。我花了几天时间把公开的技术分析翻了个遍，把攻击链拆解清楚了。这篇文章不讲宏大叙事，只讲三件事：它怎么进来的、怎么扩散的、你现在能做什么。

2026-06-12 11:14:53 194

原创用LangGraph搭一个多Agent系统，从零到能跑只要20分钟

LangGraph的核心概念是State——所有Agent共享一个状态对象，每个Agent从中读取输入、写入输出。topic: str # 调研话题search_results: list[str] # 搜索结果analysis: str # 分析要点report: str # 最终报告messages: Annotated[list, add_messages] # 对话历史messages字段必须用，不能直接写list。是一个reducer，告诉LangGraph新消息是追加而不是覆盖。

2026-06-11 11:06:17 219

原创 Xcode 27 AI Agent 实测：苹果把 Claude、ChatGPT、Gemini 都塞进了 IDE

Agent 写代码的时候就能查你们自己的文档，不用它去猜你的 API 长什么样。如果你还在用 Intel Mac，短期替代方案是 Cursor 或 Windsurf——它们能读 .xcodeproj，也有 Agent 功能，只是没有模拟器和 Preview 的深度集成。苹果自家的 SDK 补全很好，但你用 Alamofire、SnapKit 这些三方库的时候，本地模型的建议经常不对。遇到拿不准的地方会问你，不会闷头改。它会调用 Xcode 的编译器跑一遍，如果报错，它自己读错误信息，改代码，再编译。

2026-06-10 11:04:36 954

原创 Kiro 上手实测：亚马逊这个‘先写需求再写代码‘的 AI IDE，到底好不好用

亚马逊出了个 AI IDE 叫 Kiro，和 Cursor、Claude Code 最大的区别是：它让你先写需求文档，再让 AI 写代码。我花了一个周末把它装上，跑了两个项目，说说真实感受。

2026-06-08 11:03:26 508

原创 Codex 插件系统拆解：不写代码的人正在用它干掉你的内部工具

官方那6个插件覆盖不了所有场景。好消息是你可以从零写一个。我给自己的团队写了一个"内容运营"插件，接了飞书多维表格和 Google Analytics，用来做每天的内容数据复盘。

2026-06-06 11:05:56 505

原创微软开源MXC：给你的AI Agent套上安全沙箱，3分钟上手配置

MXC解决的问题很明确：AI Agent需要执行代码和调用工具，但不应该有无限制的系统访问权限。目前这个项目还是alpha阶段，API会变，策略可能过于宽松，macOS和Windows的部分功能还没补齐。但整体方向对路——用声明式策略 + 操作系统级隔离来管控Agent行为，比在应用层做权限检查靠谱得多。如果你在做Agent相关的开发，建议现在就开始跟进这个项目，至少把SDK跑起来试试。等到需要上生产的时候再从头学，来不及了。

2026-06-05 11:03:01 427

原创 Codex 插件系统实测：装上角色插件，非程序员也能让 Agent 干活

6 个预设插件之外可以自己做。my-plugin/├── manifest.json # 插件元信息├── instructions.md # 给 Codex 的工作指令├── skills/ # 技能定义└── apps/ # 工具连接配置"description": "内部数据分析插件",## 数据查询规范- 所有查询限制返回 1000 行- 涉及用户数据时自动脱敏- 优先使用 materialized view。

2026-06-04 11:12:47 705

原创 Codex不只写代码了：OpenAI插件系统实测，非程序员也能拿它干活

昨天OpenAI给Codex塞了一波新东西，我花了一晚上把能试的都试了。说实话，这次更新比我预想的要实用——不是那种"看看就行"的演示，而是真能跑起来干活的功能。

2026-06-03 11:06:54 632

原创用 browser-use 让 AI 自己操作浏览器：从安装到自动填表全流程

上周五下班前，运营同事扔过来一个需求："帮我从20个网站上把竞品价格抓下来，每天一次。我看了一眼那些网站，有的要登录，有的价格藏在弹窗里，有的还有验证码。写 Selenium 脚本？光处理登录态就得搞半天。写 Playwright？动态渲染页面调试到头秃。后来我试了 browser-use。一个 Python 库，8万多 GitHub stars，干的事情简单粗暴：你用自然语言告诉 AI 要做什么，它自己去操作浏览器。不用写 CSS 选择器，不用处理页面加载等待，AI 自己看页面、点按钮、填表单。

2026-06-02 11:06:47 638 1

原创用 Compound Engineering 插件让 Claude Code 写代码前先想清楚

最近 GitHub 趋势榜上出了个有意思的项目：EveryInc/compound-engineering-plugin。一天涨了 250 多个星，总星数快到 19000。我花了一下午装上试了试，说说感受。

2026-06-01 11:03:15 817

原创从零写一个MCP Server：让Claude Code直接操作你的数据库

上周有个朋友问我："你用Claude Code写项目，每次查数据库都要手动粘SQL结果给它吗？不用。我写了一个MCP Server，Claude Code能直接连我的SQLite数据库，查表结构、跑查询、甚至帮我写迁移脚本。整个过程不到一小时。MCP（Model Context Protocol）你可能听过很多次了，但大多数教程停留在"用别人写好的MCP Server"。今天这篇不一样——我们从零写一个，你跟着做完就能理解MCP到底怎么跑的，以后自己改、扩展都不成问题。

2026-05-31 11:04:30 235

原创 Claude Code 多Agent并行实战：一个人同时管五条开发流水线

5月12日那天，Claude Code推了Agent View功能。我当时正在用tmux开了四个Terminal窗口跑不同任务，看到消息后花了十分钟切过去试——然后tmux窗口就再没打开过。这篇文章把Claude Code目前的四种并行方案（Agent View、Subagent、Agent Teams、Worktrees）全跑了一遍，整理出每种方案的适用场景、命令和踩坑记录。你看完可以直接上手。

2026-05-30 11:08:04 1290

原创 Antigravity CLI 上手指南 — 谷歌这个 Agent 编码工具到底怎么样

Google I/O 2026 上最让开发者坐不住的消息，大概就是 Antigravity 2.0 了。93个子Agent、12小时、不到1000美元，从零造了一个能跑 Doom 的操作系统。这组数据一出来，开发者社区就炸了。但发布会归发布会，工具好不好用得自己上手才知道。这篇文章整理了 Antigravity CLI（命令行版本，命令是agy）的安装、配置和使用流程，顺便跟 Claude Code 做个横向对比，帮你判断要不要把它纳入自己的工具链。

2026-05-29 11:08:23 674

原创 0.025元跑百万Token：DeepSeek V4-Pro接入实战，思考模式到底值不值得开

API降价这件事，对大厂的战略意义我不评价，但对个人开发者来说就一句话：以前舍不得调的场景，现在可以放开用了。一个月几百块的调用成本，能跑代码review、跑文档翻译、跑数据清洗，甚至可以给自己的Side Project加一个AI功能。门槛低到几乎没有。接入代码就那几行，今天下午就能跑起来。

2026-05-28 11:04:07 902

原创接手20万行代码不慌：Understand-Anything 实测，代码秒变知识图谱

接手一个陌生项目,20万行代码摆在眼前,从哪看起?大多数人的做法是翻 README、找入口文件、grep 关键函数名,一个个跳转。运气好半天摸清脉络,运气差一周还在迷路。Understand-Anything 换了个思路:用多 Agent 流水线扫描整个代码库,提取文件、函数、类、依赖关系,生成一张交互式知识图谱。你可以在浏览器里拖拽、搜索、点击任意节点查看说明。截至今天,GitHub Trending 日榜第一,单日 4600+ star,总星数 36000+。

2026-05-27 11:06:53 870

原创 Cursor 3 多Agent并行开发实战：3路Agent同时干活不翻车的配置方法

上周 Cursor 3 正式推送，最大的变化不是界面好不好看，是它把"多 Agent 并行"做成了一等公民。我之前用 Cursor 2 的 Agent 模式也能写代码，但只能一个一个来。想让 Agent 改前端的时候顺便让另一个 Agent 写后端接口？做不到。只能等第一个搞完，再开第二个。Cursor 3 加了 Background Agents 和 Agents Window，我试了一周。踩了不少坑，也摸出一套能稳定跑的配置方法。这篇把实际操作步骤和翻车记录都写出来。

2026-05-26 11:03:26 1125

原创 MCP工具吃Token太猛？3个实测方案砍掉70%消耗

最直接的改法：MCP工具不要默认返回全文，返回结构化摘要。我写了一个叫"description": "Express中间件，校验请求头中的Bearer Token"},"description": "校验JWT Token有效性，检查黑名单"],"loc": 127一个127行的文件，全文返回大约消耗800个Token。摘要返回只消耗120个Token左右——少了85%。关键点在"按需展开"。智能体看完摘要后知道函数在第50到82行，需要看细节时，再调用一次read-lines。

2026-05-25 11:04:21 866

原创 Claude Code SubAgents 配置实战：4个现成配置，复制就能用

agents切到 Library 标签页，选 Create new agent。放在哪里？Personal（存到，所有项目都能用）还是 Project（存到，只在当前项目生效）要什么工具权限？只读、全部、还是自己选用什么模型？Haiku 便宜快，Sonnet 平衡，Opus 贵但强要不要持久记忆？开了的话 SubAgent 会在存东西。

2026-05-24 11:06:47 556

原创 Gemini 3.5 Flash 的 thinking_budget 实测：同一个问题，4档思考强度花多少钱

平均总 token平均耗时平均质量08501.9s3.451212002.8s4.4204815003.5s4.6-118004.2s4.6这里 512 和 2048 差距不大（4.4 vs 4.6），但 0 和 512 差了整整 1 分。写邮件、做摘要这种任务，模型稍微想一下，结构和措辞好很多。512 是性价比拐点。Gemini 3.5 Flash 的是个被低估的参数。用好了，同样的任务成本能省 60-70%。用不好（比如全部 -1），月底账单会很难看。

2026-05-23 11:04:28 455

原创 GitHub Copilot 下月改按量计费，我算了一周的 token 账单

微软上个月官宣：6月1日起，GitHub Copilot 全部计划转向按量计费（usage-based pricing）。原来每月19美元的订阅费变成19美元的token额度，用完就得充。我用了一周时间，把自己日常开发中 Copilot、Claude Code、Cursor 三个工具的实际 token 消耗量记下来，算了一笔账。结果挺扎心的——按新定价算，我一个月大概要花 47 美元，比原来贵了一倍多。下面是具体数据和我找到的几个省钱办法。

2026-05-22 11:09:22 1437

原创 AI Agent 记忆方案实战：从“每天失忆“到“永久记忆“的3种落地方案

用 Claude Code 跟一个项目搞了两小时，关掉终端再打开。Agent 一脸茫然——"你是谁？我们之前做了什么？这个问题我遇了不下二十次。上个月南洋理工和复旦联合发了一篇 δ-mem 的论文（arXiv:2605.12357），专门研究怎么给 LLM 加持久记忆。思路不错，但离直接能用还有距离。实际工作中，我试了3种方案来解决 Agent 失忆问题。这篇把代码、配置、踩坑全放出来。

2026-05-21 11:12:02 602

原创 AI Agent 跑5步就崩？文件即状态：多步任务成功率从40%拉到90%的实战方案

用过 Claude Code、Codex 这类 AI Agent 的人，大概都有这个体验：让它改一个文件，准得很；让它连续做5件事，中间大概率出岔子。不是忘了前面的指令，就是重复执行已经完成的步骤。我最近做了个实验：让 Agent 自动完成"搜集热点 → 筛选选题 → 写初稿 → 改写润色 → 格式化输出"这条5步流水线。跑了20次，只有8次完整跑通，失败率60%。问题出在哪？不是 Agent 不够聪明，是它没有"记忆"——每一步的状态都存在上下文窗口里，窗口一满，前面的信息就被压缩甚至丢掉了。

2026-05-20 11:07:08 480

原创 Claude Code SubAgent 实战：一个任务拆给多个AI并行干活

上周接了个需求：给一个老项目加国际化支持，涉及 38 个文件、4 种语言。我估了一下，一个人干大概要两天。用 Claude Code 单线程跑，也得四五个小时——因为它得一个文件一个文件地改，改完一个才能看下一个。然后我试了 SubAgent。结果：47 分钟搞定。不是我在吹，是任务日志里白纸黑字写着的。

2026-05-19 11:09:12 1032

原创 5个MCP Server配好，Claude Code和Cursor才算真的能干活

这5个MCP Server覆盖了日常开发最常见的场景：爬网页、操作GitHub、查数据库、读写文件、搜索信息。配一次，之后每天都在用。配置不复杂，主要是踩坑。特殊字符编码、权限设置、首次下载等待，这些琐碎问题花的时间比配置本身还多。这篇把我踩过的坑都列了。没装过MCP Server的话，建议从Firecrawl和GitHub这两个开始，装完当天就能感受到区别。

2026-05-18 11:08:06 831

原创一个命令让 Claude Code 代码探索快 4 倍：CodeGraph 实测

用 Claude Code 写代码的人大概都遇到过这种情况：让它理解一个大项目的代码结构，Explore Agent 要跑一两分钟，期间疯狂调用 grep、find、Read，光 token 就烧掉好几万。上周我在 GitHub Trending 上看到一个叫 CodeGraph 的工具，作者的思路很直接——既然 Agent 每次都要从头扫描文件来理解代码，那为什么不提前把代码的符号关系建好索引？Agent 查索引就行了，不用再一个文件一个文件地翻。我在自己的项目上试了试，效果确实明显。

2026-05-17 11:17:10 6834

原创用 n8n-MCP 让 Claude Code 直接帮你搭工作流，20分钟跑通

我之前搭自动化工作流有个习惯：打开 n8n 编辑器，拖节点、连线、配参数。一个 Webhook 接 Slack 通知的流程，拖来拖去也要半小时。上周试了 n8n-MCP 这个项目，体验完全不一样。在 Claude Code 终端里说一句"帮我建个 Webhook 触发、发 Slack 消息的工作流"，它自己查节点文档、配参数、做校验，最后直接部署到 n8n 实例上。整个过程不到 5 分钟。GitHub 上这个项目现在 2 万星了。今天把我的配置过程和踩的坑完整记一遍。

2026-05-16 11:30:24 942

原创 MCP 踩坑手记：给 AI 接数据库时我犯的 5 个错误

2024 年底 Anthropic 开源了 Model Context Protocol（MCP），到现在一年半，月下载量已经破了 1.1 亿次。增速比当年 React 还猛。但下载量不等于用好了。我在自己的项目里前后接了 6 个 MCP Server，过程中踩坑花的时间比写业务代码还多。把这些问题和解法记下来，你应该能少走几天弯路。

2026-05-15 11:10:15 768

原创大仓库用AI编程太烧钱？这个MCP插件帮你省80%上下文开销

用Claude Code处理10万行以上的项目，你大概经历过这个场景：问一句"Stripe的webhook在哪处理的"，Agent开始grep整个仓库，30秒过去了，上下文窗口塞满，token账单飞涨，最后给的答案还不一定对。本周GitHub Trending上冒出来一个项目叫 claude-context，Zilliz团队做的，一周拿了1万多star。它干的事情说穿了很简单——把你的代码库做一次向量索引，之后AI编程工具每次提问，走语义搜索捞相关代码，不用把整个目录塞进上下文了。

2026-05-14 11:04:31 826

原创 Coder Agents 上手：把AI编程Agent部署到自己的服务器上

用 Claude Code、Cursor、Codex 写代码，已经是很多开发者的日常。但如果你在金融、政府、医疗这类行业工作，一个绕不开的问题是：代码要发到第三方云端。Coder 在 5 月 6 日发布了 Coder Agents beta。一个 AI 编程 Agent，整套系统跑在你自己的服务器上，控制面、编排层、执行环境都在内网。源码、prompt、模型交互不出去。这篇文章记录我从零部署 Coder Agents 的过程，包括踩过的坑。

2026-05-13 11:45:59 679

原创你的AI编程助手每次都失忆？agentmemory实测：一条命令搞定跨会话记忆

用Claude Code写项目，第一天配好了JWT鉴权，第二天让它加限流逻辑，结果它问你："你们的鉴权方案是什么？" 用Cursor处理数据库优化，上午刚修完N+1查询，下午换个session它又忘了。这种"AI失忆症"谁都遇到过。CLAUDE.md、.cursorrules这些内置记忆方案能缓解一些，但200行的上限撑不了多久，内容一多就过时。最近GitHub上有个叫agentmemory的项目火了起来（4800+星，日增400+），号称能给所有主流AI编程工具加上持久记忆。

2026-05-12 11:04:20 672

原创 Coder Agents 上手：把AI编程Agent部署到自己的服务器上

用 Claude Code、Cursor、Codex 写代码，已经是很多开发者的日常。但如果你在金融、政府、医疗这类行业工作，一个绕不开的问题是：代码要发到第三方云端。Coder 在 5 月 6 日发布了 Coder Agents beta。一个 AI 编程 Agent，整套系统跑在你自己的服务器上，控制面、编排层、执行环境都在内网。源码、prompt、模型交互不出去。这篇文章记录我从零部署 Coder Agents 的过程，包括踩过的坑。

2026-05-11 23:51:33 1001

原创 Claude Code Hooks 实战：5个配置让AI编程助手自动守规矩

Hooks 的设计思路很简单：Claude 是非确定性的（LLM 嘛），但你的工程流程需要确定性。Hooks 在两者之间加了一层确定性的控制点。这 5 个配置覆盖了我日常 80% 的场景。你可以根据自己的项目需求改脚本内容，整体框架直接复制就行。如果你想了解更多事件类型（比如 SubagentStart、FileChanged、WorktreeCreate），可以查看官方文档 code.claude.com/docs/en/hooks。

2026-05-09 11:04:43 834

原创 Claude Code Hooks 实战：6个自动化脚本，省掉每天30分钟重复操作

Hooks 的思路很简单：把重复的操作自动化，把危险的操作拦住，把重要的信息自动喂给 Claude。上面6个配置覆盖了最常见的场景。你可以直接复制到自己的里，改改路径和命令就能用。如果你有其他好用的 Hook 配置，评论区见。

2026-05-08 11:07:31 994

原创用Google ADK从零搭一个能调工具的AI Agent：Python实操全过程

Google ADK的定位很清楚：降低Agent开发门槛。它做到了——一个Python函数就是一个工具，一个Agent类就是一个智能体，内置了调试界面和MCP支持。如果你之前没碰过Agent开发，ADK是个不错的起点。如果你已经在用LangGraph或CrewAI，ADK可以作为快速原型验证的工具。项目地址：https://github.com/google/adk-python文档：https://adk.dev。

2026-05-07 11:04:20 635

原创两周5000 Star：用一个Markdown文件给Claude Code装技能包

Skills 门槛低，写一个 Markdown 文件就能用。但要写好有讲究——description 的措辞、步骤的拆分粒度、边界条件的处理，都影响 AI 的执行效果。如果你已经在用 Claude Code 或 Cursor，建议先装两三个 trending 上的 Skill 感受一下，然后按自己的工作流写几个。比起每次从零跟 AI 解释需求，Skill 能把重复的沟通成本降下来。GitHub Trending 上这些 Skills 项目的地址都在文章里了，直接 clone 就能用。

2026-05-06 11:13:07 878

空空如也

空空如也