自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(81)
  • 收藏
  • 关注

原创 Context Engineering实战:4个文件让AI编程助手真正读懂你的项目

但用了三个月后,你会发现一个反复出现的问题:AI生成的代码不遵守你的项目规范。它不知道你上季度把REST换成了GraphQL,不知道你废弃了那个认证库,也不知道你的架构师刻意把每个服务控制在500行以内。Phil Schmid在2025年中说过:这是"在正确的时间,以正确的格式,给模型正确的信息和工具"。你的项目规范、架构决策、踩过的坑,它一概不知。Packmind今年1月的调查:91%的工程团队用了至少一种AI编程工具,但在同时用6个以上工具的团队里,只有28%的人对代码质量有信心。

2026-06-18 11:08:16 233

原创 Zvec v0.5.0实战:不用部署服务,Python几行代码搞定向量检索+全文搜索

Zvec v0.5.0加了全文检索和混合检索之后,嵌入式向量数据库该有的功能基本齐了。个人项目、本地RAG、边缘部署,pip install完就能跑,不用折腾Docker和服务配置,省心不少。DiskANN索引让它能处理更大规模的数据而不吃太多内存,不再只能当原型验证的工具了。代码仓库:https://github.com/alibaba/zvec文档:https://zvec.org。

2026-06-17 11:08:28 236

原创 MIT追踪10万开发者:AI让代码量翻了17倍,但交付只多了30%

MIT这项研究让我想到了一个比喻:AI编程工具像是给了每个人一台高速打印机,但从打印到出版之间还差了编辑、排版、审校、发行的距离。打印机再快,不解决后面的环节,书架上不会凭空多出好书来。论文链接:https://www.nber.org/papers/w35275。

2026-06-16 10:47:15 258

原创 Claude Code Hooks 实战:6个配置让你的AI编程助手不再“自由发挥“

用过 Claude Code 的人都知道一个问题:你告诉它"每次改完文件跑一下 Prettier",它有时候会照做,有时候会忘。你说"别动我的 .env 文件",它多数时候会听,但偶尔还是会手贱改一下。这不是 Claude Code 的 bug,是大语言模型的本质——概率性输出。你用自然语言下的指令,它不保证每次都执行。Hooks 就是来解决这个问题的。它是 Claude Code 的生命周期脚本机制,在特定时机自动触发 shell 命令,跟 Git Hooks 一个道理。

2026-06-14 11:07:15 261

原创 Firecrawl /monitor 实战:网页一变,Agent 就动

你的 AI Agent 怎么知道某个网页更新了?最笨的办法是轮询:每隔几分钟抓一遍页面,拿新内容和旧内容做 diff。这事不难,但烦——得自己写 cron、存快照、处理 diff、搭 webhook、过滤噪音(广告、时间戳、session token 之类的变化全得跳过)。搞一个页面还行,监控几十个页面就变成了运维噩梦。Firecrawl 5月底上线了/monitor端点,把这套流程打包成了一个 API 调用。我花了两天把它接进自己的 Agent 工作流里,记录一下踩坑过程。

2026-06-13 11:08:34 213

原创 Miasma蠕虫实战复盘:你clone的仓库正在偷你的云凭证

上周五(6月5日),微软在GitHub上的73个仓库被一次性禁用。原因不是误操作,是一个叫Miasma的蠕虫在105秒内感染了Azure、Azure-Samples、Microsoft、MicrosoftDocs四个组织下的仓库。我花了几天时间把公开的技术分析翻了个遍,把攻击链拆解清楚了。这篇文章不讲宏大叙事,只讲三件事:它怎么进来的、怎么扩散的、你现在能做什么。

2026-06-12 11:14:53 189

原创 用LangGraph搭一个多Agent系统,从零到能跑只要20分钟

LangGraph的核心概念是State——所有Agent共享一个状态对象,每个Agent从中读取输入、写入输出。topic: str # 调研话题search_results: list[str] # 搜索结果analysis: str # 分析要点report: str # 最终报告messages: Annotated[list, add_messages] # 对话历史messages字段必须用,不能直接写list。是一个reducer,告诉LangGraph新消息是追加而不是覆盖。

2026-06-11 11:06:17 211

原创 Xcode 27 AI Agent 实测:苹果把 Claude、ChatGPT、Gemini 都塞进了 IDE

Agent 写代码的时候就能查你们自己的文档,不用它去猜你的 API 长什么样。如果你还在用 Intel Mac,短期替代方案是 Cursor 或 Windsurf——它们能读 .xcodeproj,也有 Agent 功能,只是没有模拟器和 Preview 的深度集成。苹果自家的 SDK 补全很好,但你用 Alamofire、SnapKit 这些三方库的时候,本地模型的建议经常不对。遇到拿不准的地方会问你,不会闷头改。它会调用 Xcode 的编译器跑一遍,如果报错,它自己读错误信息,改代码,再编译。

2026-06-10 11:04:36 792

原创 Kiro 上手实测:亚马逊这个‘先写需求再写代码‘的 AI IDE,到底好不好用

亚马逊出了个 AI IDE 叫 Kiro,和 Cursor、Claude Code 最大的区别是:它让你先写需求文档,再让 AI 写代码。我花了一个周末把它装上,跑了两个项目,说说真实感受。

2026-06-08 11:03:26 477

原创 Codex 插件系统拆解:不写代码的人正在用它干掉你的内部工具

官方那6个插件覆盖不了所有场景。好消息是你可以从零写一个。我给自己的团队写了一个"内容运营"插件,接了飞书多维表格和 Google Analytics,用来做每天的内容数据复盘。

2026-06-06 11:05:56 422

原创 微软开源MXC:给你的AI Agent套上安全沙箱,3分钟上手配置

MXC解决的问题很明确:AI Agent需要执行代码和调用工具,但不应该有无限制的系统访问权限。目前这个项目还是alpha阶段,API会变,策略可能过于宽松,macOS和Windows的部分功能还没补齐。但整体方向对路——用声明式策略 + 操作系统级隔离来管控Agent行为,比在应用层做权限检查靠谱得多。如果你在做Agent相关的开发,建议现在就开始跟进这个项目,至少把SDK跑起来试试。等到需要上生产的时候再从头学,来不及了。

2026-06-05 11:03:01 345

原创 Codex 插件系统实测:装上角色插件,非程序员也能让 Agent 干活

6 个预设插件之外可以自己做。my-plugin/├── manifest.json # 插件元信息├── instructions.md # 给 Codex 的工作指令├── skills/ # 技能定义└── apps/ # 工具连接配置"description": "内部数据分析插件",## 数据查询规范- 所有查询限制返回 1000 行- 涉及用户数据时自动脱敏- 优先使用 materialized view。

2026-06-04 11:12:47 652

原创 Codex不只写代码了:OpenAI插件系统实测,非程序员也能拿它干活

昨天OpenAI给Codex塞了一波新东西,我花了一晚上把能试的都试了。说实话,这次更新比我预想的要实用——不是那种"看看就行"的演示,而是真能跑起来干活的功能。

2026-06-03 11:06:54 572

原创 用 browser-use 让 AI 自己操作浏览器:从安装到自动填表全流程

上周五下班前,运营同事扔过来一个需求:"帮我从20个网站上把竞品价格抓下来,每天一次。我看了一眼那些网站,有的要登录,有的价格藏在弹窗里,有的还有验证码。写 Selenium 脚本?光处理登录态就得搞半天。写 Playwright?动态渲染页面调试到头秃。后来我试了 browser-use。一个 Python 库,8万多 GitHub stars,干的事情简单粗暴:你用自然语言告诉 AI 要做什么,它自己去操作浏览器。不用写 CSS 选择器,不用处理页面加载等待,AI 自己看页面、点按钮、填表单。

2026-06-02 11:06:47 623 1

原创 用 Compound Engineering 插件让 Claude Code 写代码前先想清楚

最近 GitHub 趋势榜上出了个有意思的项目:EveryInc/compound-engineering-plugin。一天涨了 250 多个星,总星数快到 19000。我花了一下午装上试了试,说说感受。

2026-06-01 11:03:15 770

原创 从零写一个MCP Server:让Claude Code直接操作你的数据库

上周有个朋友问我:"你用Claude Code写项目,每次查数据库都要手动粘SQL结果给它吗?不用。我写了一个MCP Server,Claude Code能直接连我的SQLite数据库,查表结构、跑查询、甚至帮我写迁移脚本。整个过程不到一小时。MCP(Model Context Protocol)你可能听过很多次了,但大多数教程停留在"用别人写好的MCP Server"。今天这篇不一样——我们从零写一个,你跟着做完就能理解MCP到底怎么跑的,以后自己改、扩展都不成问题。

2026-05-31 11:04:30 221

原创 Claude Code 多Agent并行实战:一个人同时管五条开发流水线

5月12日那天,Claude Code推了Agent View功能。我当时正在用tmux开了四个Terminal窗口跑不同任务,看到消息后花了十分钟切过去试——然后tmux窗口就再没打开过。这篇文章把Claude Code目前的四种并行方案(Agent View、Subagent、Agent Teams、Worktrees)全跑了一遍,整理出每种方案的适用场景、命令和踩坑记录。你看完可以直接上手。

2026-05-30 11:08:04 629

原创 Antigravity CLI 上手指南 — 谷歌这个 Agent 编码工具到底怎么样

Google I/O 2026 上最让开发者坐不住的消息,大概就是 Antigravity 2.0 了。93个子Agent、12小时、不到1000美元,从零造了一个能跑 Doom 的操作系统。这组数据一出来,开发者社区就炸了。但发布会归发布会,工具好不好用得自己上手才知道。这篇文章整理了 Antigravity CLI(命令行版本,命令是agy)的安装、配置和使用流程,顺便跟 Claude Code 做个横向对比,帮你判断要不要把它纳入自己的工具链。

2026-05-29 11:08:23 494

原创 0.025元跑百万Token:DeepSeek V4-Pro接入实战,思考模式到底值不值得开

API降价这件事,对大厂的战略意义我不评价,但对个人开发者来说就一句话:以前舍不得调的场景,现在可以放开用了。一个月几百块的调用成本,能跑代码review、跑文档翻译、跑数据清洗,甚至可以给自己的Side Project加一个AI功能。门槛低到几乎没有。接入代码就那几行,今天下午就能跑起来。

2026-05-28 11:04:07 848

原创 接手20万行代码不慌:Understand-Anything 实测,代码秒变知识图谱

接手一个陌生项目,20万行代码摆在眼前,从哪看起?大多数人的做法是翻 README、找入口文件、grep 关键函数名,一个个跳转。运气好半天摸清脉络,运气差一周还在迷路。Understand-Anything 换了个思路:用多 Agent 流水线扫描整个代码库,提取文件、函数、类、依赖关系,生成一张交互式知识图谱。你可以在浏览器里拖拽、搜索、点击任意节点查看说明。截至今天,GitHub Trending 日榜第一,单日 4600+ star,总星数 36000+。

2026-05-27 11:06:53 841

原创 Cursor 3 多Agent并行开发实战:3路Agent同时干活不翻车的配置方法

上周 Cursor 3 正式推送,最大的变化不是界面好不好看,是它把"多 Agent 并行"做成了一等公民。我之前用 Cursor 2 的 Agent 模式也能写代码,但只能一个一个来。想让 Agent 改前端的时候顺便让另一个 Agent 写后端接口?做不到。只能等第一个搞完,再开第二个。Cursor 3 加了 Background Agents 和 Agents Window,我试了一周。踩了不少坑,也摸出一套能稳定跑的配置方法。这篇把实际操作步骤和翻车记录都写出来。

2026-05-26 11:03:26 920

原创 MCP工具吃Token太猛?3个实测方案砍掉70%消耗

最直接的改法:MCP工具不要默认返回全文,返回结构化摘要。我写了一个叫"description": "Express中间件,校验请求头中的Bearer Token"},"description": "校验JWT Token有效性,检查黑名单"],"loc": 127一个127行的文件,全文返回大约消耗800个Token。摘要返回只消耗120个Token左右——少了85%。关键点在"按需展开"。智能体看完摘要后知道函数在第50到82行,需要看细节时,再调用一次read-lines。

2026-05-25 11:04:21 840

原创 Claude Code SubAgents 配置实战:4个现成配置,复制就能用

agents切到 Library 标签页,选 Create new agent。放在哪里?Personal(存到,所有项目都能用)还是 Project(存到,只在当前项目生效)要什么工具权限?只读、全部、还是自己选用什么模型?Haiku 便宜快,Sonnet 平衡,Opus 贵但强要不要持久记忆?开了的话 SubAgent 会在存东西。

2026-05-24 11:06:47 488

原创 Gemini 3.5 Flash 的 thinking_budget 实测:同一个问题,4档思考强度花多少钱

平均总 token平均耗时平均质量08501.9s3.451212002.8s4.4204815003.5s4.6-118004.2s4.6这里 512 和 2048 差距不大(4.4 vs 4.6),但 0 和 512 差了整整 1 分。写邮件、做摘要这种任务,模型稍微想一下,结构和措辞好很多。512 是性价比拐点。Gemini 3.5 Flash 的是个被低估的参数。用好了,同样的任务成本能省 60-70%。用不好(比如全部 -1),月底账单会很难看。

2026-05-23 11:04:28 423

原创 GitHub Copilot 下月改按量计费,我算了一周的 token 账单

微软上个月官宣:6月1日起,GitHub Copilot 全部计划转向按量计费(usage-based pricing)。原来每月19美元的订阅费变成19美元的token额度,用完就得充。我用了一周时间,把自己日常开发中 Copilot、Claude Code、Cursor 三个工具的实际 token 消耗量记下来,算了一笔账。结果挺扎心的——按新定价算,我一个月大概要花 47 美元,比原来贵了一倍多。下面是具体数据和我找到的几个省钱办法。

2026-05-22 11:09:22 1366

原创 AI Agent 记忆方案实战:从“每天失忆“到“永久记忆“的3种落地方案

用 Claude Code 跟一个项目搞了两小时,关掉终端再打开。Agent 一脸茫然——"你是谁?我们之前做了什么?这个问题我遇了不下二十次。上个月南洋理工和复旦联合发了一篇 δ-mem 的论文(arXiv:2605.12357),专门研究怎么给 LLM 加持久记忆。思路不错,但离直接能用还有距离。实际工作中,我试了3种方案来解决 Agent 失忆问题。这篇把代码、配置、踩坑全放出来。

2026-05-21 11:12:02 577

原创 AI Agent 跑5步就崩?文件即状态:多步任务成功率从40%拉到90%的实战方案

用过 Claude Code、Codex 这类 AI Agent 的人,大概都有这个体验:让它改一个文件,准得很;让它连续做5件事,中间大概率出岔子。不是忘了前面的指令,就是重复执行已经完成的步骤。我最近做了个实验:让 Agent 自动完成"搜集热点 → 筛选选题 → 写初稿 → 改写润色 → 格式化输出"这条5步流水线。跑了20次,只有8次完整跑通,失败率60%。问题出在哪?不是 Agent 不够聪明,是它没有"记忆"——每一步的状态都存在上下文窗口里,窗口一满,前面的信息就被压缩甚至丢掉了。

2026-05-20 11:07:08 472

原创 Claude Code SubAgent 实战:一个任务拆给多个AI并行干活

上周接了个需求:给一个老项目加国际化支持,涉及 38 个文件、4 种语言。我估了一下,一个人干大概要两天。用 Claude Code 单线程跑,也得四五个小时——因为它得一个文件一个文件地改,改完一个才能看下一个。然后我试了 SubAgent。结果:47 分钟搞定。不是我在吹,是任务日志里白纸黑字写着的。

2026-05-19 11:09:12 967

原创 5个MCP Server配好,Claude Code和Cursor才算真的能干活

这5个MCP Server覆盖了日常开发最常见的场景:爬网页、操作GitHub、查数据库、读写文件、搜索信息。配一次,之后每天都在用。配置不复杂,主要是踩坑。特殊字符编码、权限设置、首次下载等待,这些琐碎问题花的时间比配置本身还多。这篇把我踩过的坑都列了。没装过MCP Server的话,建议从Firecrawl和GitHub这两个开始,装完当天就能感受到区别。

2026-05-18 11:08:06 797

原创 一个命令让 Claude Code 代码探索快 4 倍:CodeGraph 实测

用 Claude Code 写代码的人大概都遇到过这种情况:让它理解一个大项目的代码结构,Explore Agent 要跑一两分钟,期间疯狂调用 grep、find、Read,光 token 就烧掉好几万。上周我在 GitHub Trending 上看到一个叫 CodeGraph 的工具,作者的思路很直接——既然 Agent 每次都要从头扫描文件来理解代码,那为什么不提前把代码的符号关系建好索引?Agent 查索引就行了,不用再一个文件一个文件地翻。我在自己的项目上试了试,效果确实明显。

2026-05-17 11:17:10 5885

原创 用 n8n-MCP 让 Claude Code 直接帮你搭工作流,20分钟跑通

我之前搭自动化工作流有个习惯:打开 n8n 编辑器,拖节点、连线、配参数。一个 Webhook 接 Slack 通知的流程,拖来拖去也要半小时。上周试了 n8n-MCP 这个项目,体验完全不一样。在 Claude Code 终端里说一句"帮我建个 Webhook 触发、发 Slack 消息的工作流",它自己查节点文档、配参数、做校验,最后直接部署到 n8n 实例上。整个过程不到 5 分钟。GitHub 上这个项目现在 2 万星了。今天把我的配置过程和踩的坑完整记一遍。

2026-05-16 11:30:24 892

原创 MCP 踩坑手记:给 AI 接数据库时我犯的 5 个错误

2024 年底 Anthropic 开源了 Model Context Protocol(MCP),到现在一年半,月下载量已经破了 1.1 亿次。增速比当年 React 还猛。但下载量不等于用好了。我在自己的项目里前后接了 6 个 MCP Server,过程中踩坑花的时间比写业务代码还多。把这些问题和解法记下来,你应该能少走几天弯路。

2026-05-15 11:10:15 745

原创 大仓库用AI编程太烧钱?这个MCP插件帮你省80%上下文开销

用Claude Code处理10万行以上的项目,你大概经历过这个场景:问一句"Stripe的webhook在哪处理的",Agent开始grep整个仓库,30秒过去了,上下文窗口塞满,token账单飞涨,最后给的答案还不一定对。本周GitHub Trending上冒出来一个项目叫 claude-context,Zilliz团队做的,一周拿了1万多star。它干的事情说穿了很简单——把你的代码库做一次向量索引,之后AI编程工具每次提问,走语义搜索捞相关代码,不用把整个目录塞进上下文了。

2026-05-14 11:04:31 821

原创 Coder Agents 上手:把AI编程Agent部署到自己的服务器上

用 Claude Code、Cursor、Codex 写代码,已经是很多开发者的日常。但如果你在金融、政府、医疗这类行业工作,一个绕不开的问题是:代码要发到第三方云端。Coder 在 5 月 6 日发布了 Coder Agents beta。一个 AI 编程 Agent,整套系统跑在你自己的服务器上,控制面、编排层、执行环境都在内网。源码、prompt、模型交互不出去。这篇文章记录我从零部署 Coder Agents 的过程,包括踩过的坑。

2026-05-13 11:45:59 668

原创 你的AI编程助手每次都失忆?agentmemory实测:一条命令搞定跨会话记忆

用Claude Code写项目,第一天配好了JWT鉴权,第二天让它加限流逻辑,结果它问你:"你们的鉴权方案是什么?" 用Cursor处理数据库优化,上午刚修完N+1查询,下午换个session它又忘了。这种"AI失忆症"谁都遇到过。CLAUDE.md、.cursorrules这些内置记忆方案能缓解一些,但200行的上限撑不了多久,内容一多就过时。最近GitHub上有个叫agentmemory的项目火了起来(4800+星,日增400+),号称能给所有主流AI编程工具加上持久记忆。

2026-05-12 11:04:20 637

原创 Coder Agents 上手:把AI编程Agent部署到自己的服务器上

用 Claude Code、Cursor、Codex 写代码,已经是很多开发者的日常。但如果你在金融、政府、医疗这类行业工作,一个绕不开的问题是:代码要发到第三方云端。Coder 在 5 月 6 日发布了 Coder Agents beta。一个 AI 编程 Agent,整套系统跑在你自己的服务器上,控制面、编排层、执行环境都在内网。源码、prompt、模型交互不出去。这篇文章记录我从零部署 Coder Agents 的过程,包括踩过的坑。

2026-05-11 23:51:33 986

原创 Claude Code Hooks 实战:5个配置让AI编程助手自动守规矩

Hooks 的设计思路很简单:Claude 是非确定性的(LLM 嘛),但你的工程流程需要确定性。Hooks 在两者之间加了一层确定性的控制点。这 5 个配置覆盖了我日常 80% 的场景。你可以根据自己的项目需求改脚本内容,整体框架直接复制就行。如果你想了解更多事件类型(比如 SubagentStart、FileChanged、WorktreeCreate),可以查看官方文档 code.claude.com/docs/en/hooks。

2026-05-09 11:04:43 770

原创 Claude Code Hooks 实战:6个自动化脚本,省掉每天30分钟重复操作

Hooks 的思路很简单:把重复的操作自动化,把危险的操作拦住,把重要的信息自动喂给 Claude。上面6个配置覆盖了最常见的场景。你可以直接复制到自己的里,改改路径和命令就能用。如果你有其他好用的 Hook 配置,评论区见。

2026-05-08 11:07:31 914

原创 用Google ADK从零搭一个能调工具的AI Agent:Python实操全过程

Google ADK的定位很清楚:降低Agent开发门槛。它做到了——一个Python函数就是一个工具,一个Agent类就是一个智能体,内置了调试界面和MCP支持。如果你之前没碰过Agent开发,ADK是个不错的起点。如果你已经在用LangGraph或CrewAI,ADK可以作为快速原型验证的工具。项目地址:https://github.com/google/adk-python文档:https://adk.dev。

2026-05-07 11:04:20 627

原创 两周5000 Star:用一个Markdown文件给Claude Code装技能包

Skills 门槛低,写一个 Markdown 文件就能用。但要写好有讲究——description 的措辞、步骤的拆分粒度、边界条件的处理,都影响 AI 的执行效果。如果你已经在用 Claude Code 或 Cursor,建议先装两三个 trending 上的 Skill 感受一下,然后按自己的工作流写几个。比起每次从零跟 AI 解释需求,Skill 能把重复的沟通成本降下来。GitHub Trending 上这些 Skills 项目的地址都在文章里了,直接 clone 就能用。

2026-05-06 11:13:07 806

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除