- 博客(2142)
- 收藏
- 关注
原创 Gemma 4 发布:开源模型终于能在浏览器里跑 Agent 了
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群说实话,开源模型发布已经不算新闻了。每个月都有新模型出来,benchmark 一个比一个好看。但 Gemma 4 有几个点让我觉得确实值得聊一聊——不是因为它"最强",而是因为它可能是,而且落地路径对前端开发者来说特别友好。
2026-04-10 09:08:05
65
原创 AI 上线前的验收清单,你可能一条都没做
你的 Agent 效果很好,但日志没有,出了事找不到原因——不能上线。权限没收,Agent 能直接改数据库——不能上线。没有 kill switch,跑飞了停不下来——不能上线。上一篇讲了 Eval——怎么判断你的 AI 是变好了还是变差了。但 Eval 告诉你的是"好不好",不是"能不能放出去"。这一篇就把上线前该检查的东西拉一个清单。不是什么"最佳实践理论",而是。,加入前端Q技术交流群。
2026-04-10 09:08:05
10
原创 你的 AI 改了 3 版,到底有没有变好?
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群。前面四个模块解决了"给模型看什么"(Context)、"让模型怎么动手"(Tool)、"多步怎么协调"(Workflow)。说实话,大部分做 AI 产品的团队在这个问题上是靠"感觉"的。改了 Prompt,跑两个 case 看看,觉得"好像还行"就上线了。直到有一天用户反馈"以前能答对的问题现在答不对了",才发现改坏了。这就是 Eval(评测)要解决的问题。
2026-04-09 10:07:08
8
原创 OMC 爆火:给 Claude Code 装上多智能体编排,效率翻 3-5 倍
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群(简称 OMC)。第一眼看名字就知道灵感来源——就像 oh-my-zsh 让终端开箱即用一样,OMC 的目标是让 Claude Code 从"一个 AI 助手"变成"一支 AI 团队"。不是那种"装了锦上添花"的东西,而是会实质性改变你用 Claude Code 方式的工具。
2026-04-09 10:07:08
432
原创 从 gstack 爆火看趋势:AI Coding 正在变成流水线
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前三篇讲了 Workflow Harness 的三个核心机制:状态机、循环防护、Checkpoint。这一篇换个角度——看看 Workflow Harness 在真实产品里是怎么落地的。最近最火的案例就是。Y Combinator 的 CEO Garry Tan 开源了一套 Claude Code 工作流系统,号称一个人用 AI 每天写 1 万到 2 万行生产代码,60 天写了 60 万行(其中 35% 是测试)。
2026-04-08 09:48:04
28
原创 Cursor 3 正式发布:从代码编辑器到 Agent 调度中心
之前 AI 做后端逻辑很强,但做 UI 经常"对不上"——你说"按钮间距大了",AI 不知道你说的是哪个按钮。现在可以直接指给它看,这对前端 CSS 调试的效率提升是量级的。
2026-04-08 09:48:04
446
原创 AI 任务做到一半崩了怎么办?Checkpoint 救命指南
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了循环防护,解决了"Agent 跑不停"的问题。网络抖动、API 限流、服务器重启、用户刷新页面——任何一个都可能让一个跑了 30 秒、消耗了 2 万 token 的 Workflow 瞬间归零。然后呢?从头再来。用户等两遍,token 花两遍。Checkpoint(检查点)就是解决这个问题的。
2026-04-07 09:48:56
36
原创 2026 年用 AI 赚钱的 5 条真实路径,哪条适合开发者?
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群如果你想系统地学习AI,推荐一波我的2个合集,和。这几个月 AI 赚钱的信息太多了,小红书刷三屏有两屏在教你月入过万。我自己研究了其中几条路,说几句真话——大部分"被动收入"叙事都是卖课前置。但确实有几条路是的。我按自己的判断,把它们分成了 5 条,从最适合开发者的讲到最不推荐的。先放一张总览表,后面逐条展开聊。
2026-04-07 09:48:56
520
原创 Agent 为什么跑着跑着就死循环了
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了怎么给 Agent 加状态机。Agent 做"搜索 → 写稿 → 评审 → 不合格 → 重写 → 评审 → 又不合格 → 又重写...",无限循环下去,token 烧完了文章还没过审。这不是个例。只要你的 Workflow 里有回边(从后面的节点跳回前面),就有可能出现死循环。LangGraph 直接内置了参数,OpenAI 在 Agent 最佳实践里也专门提到了 max iterations —— 说明这是个行业公认的痛点。
2026-04-05 11:27:34
13
原创 一个前端开发者的 AI Agent 创业成本全拆解
权限怎么做、进度怎么展示、错误怎么让人类接管、怎么在客户现有系统里"像原生功能一样"出现、怎么让非技术用户也能配置 Agent 的行为——这些都是前端每天在处理的命题。很多纯后端的 Agent 创业团队,技术很强,但产品出来后用户一看:一个命令行界面、一坨 JSON 输出、没有任何交互引导。客户转身就走了。你会做产品壳、会做交互、会做"让人觉得靠谱"的界面,这不是锦上添花,这是。
2026-04-05 11:27:34
501
原创 单轮调用撑不住了?是时候给 Agent 加状态机
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群从这一篇开始进入 Harness 七层的第四层:Workflow Harness。前面两个模块解决了"给模型看什么"(Context Harness)和"让模型怎么动手"(Tool Harness)。你让 Agent 做一件复杂的事,比如"帮我调研 RAG 技术,整理成一篇文章",这不是一个工具调一次就能搞定的。它至少需要:搜索 → 筛选 → 阅读 → 整理 → 生成 → 检查。
2026-04-04 10:12:53
45
原创 Claude Code 源码泄露:51 万行代码暴露了 AI Agent 的完整设计哲学
我之前写过一篇上下文压缩的文章,当时还在想"实际产品里到底怎么做分级"。这次泄露直接给了答案。
2026-04-04 10:12:53
543
原创 你写的 Tool Schema,模型根本看不懂
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了工具不稳定的 4 个原因和 4 层防护。为什么说最根本?因为 schema 写得好不好,直接决定了模型在第一步就能不能正确理解你的工具。参数校验、重试、结果校验都是"出了错之后的补救",而好的 schema 是"从源头减少出错"。
2026-04-03 10:27:31
11
原创 你的 Agent 又调错工具了?4 层防护缺一不可
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群从这一篇开始进入 Harness 七层的第二层:Tool Harness。上下文管好了,模型知道该做什么了——但接下来它要"动手"。动手的方式就是调用工具(Tool Calling / Function Calling)。OpenAI 社区论坛上有大量开发者反馈 GPT-4o 的 function calling 失败率可以达到 30% 甚至更高。有人用官方示例测试,10 次调用只成功 3 次。
2026-04-02 10:55:36
286
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
42
原创 Pretext:前端文本布局的性能革命
维度说明是什么15KB 零依赖 TypeScript 文本布局库核心能力不碰 DOM 完成多行文本测量和布局性能比 DOM 方案快 300~500 倍,可在 120fps 下每帧调用作者适合聊天界面、AI 流式输出、瀑布流、编辑排版、虚拟滚动、文字动画不适合简单静态文本展示、不需要动态测量的场景状态2026.3 发布,MIT 开源,23000+ Star,API 可能还会演进Pretext 的意义不只是"快了 500 倍"。
2026-04-01 09:14:03
536
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
37
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
29
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
42
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
43
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
33
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
43
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
35
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
41
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
30
原创 CDP 是什么:前端人应该知道的浏览器远程控制协议
作为前端开发者,理解 CDP 能帮你看懂 Puppeteer/Playwright 的设计,也能帮你在 AI 时代更好地做浏览器自动化。CDP 就是给这台车装了一套远程遥控系统——你不在车里,也能通过遥控器让车启动、转弯、停车、拍照。Puppeteer 底层就是 CDP,你用 Puppeteer 就是在用 CDP,只是不用自己拼 JSON。看到了吧——从你每天用的 DevTools,到 CI 里跑的 E2E 测试,到现在最火的 AI 浏览器自动化,现在,AI Agent 成了最大的新用户群。
2026-03-31 09:37:00
497
原创 Context Harness:别再把上下文一股脑塞给模型了
从这一篇开始,我们正式进入 Harness 七层结构的第一层:Context Harness。信息给错了,模型能力再强也白搭。信息给多了,模型反而容易迷路。这个"甜蜜区间"不是我编的,是实际工程里反复验证的经验。很多人以为,上下文窗口越大,就可以把所有信息都塞进去。Context Harness 的三层结构。给什么、给多少、什么时候给、什么时候收。模型只能根据它"看到的信息"做决策。不要无脑往里塞,要有策略地管。模型缺信息,容易猜、容易编造。信息过载,关键内容被"淹没"适中(40%-60%)
2026-03-31 09:37:00
16
原创 为什么 Demo 总能跑,系统却总是失控
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前三篇我们把概念框架搭好了。这一篇开始讲工程现实。如果你做过任何一个 AI 项目,大概率遇到过这种情况:Demo 阶段一切顺利,但一到真实环境,问题就像翻倍了一样冒出来。这不是偶然。Demo 和系统之间,天然存在 5 条断裂带。
2026-03-30 09:57:57
14
原创 Harness、Agent、Workflow、Framework:这些词到底怎么区分
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前两篇我们已经把大框架搭起来了。第一篇讲的是:为什么现在值得聊 Harness。第二篇讲的是:Prompt、Agent、Workflow、Eval、Harness、Product 之间到底是什么关系。最常见的场景是这样的:▸别人说“我们要上 Agent”▸你理解成“要做一个复杂 Workflow”▸另一个人说“直接上 Framework 就行”▸最后你们讨论了半天,发现每个人脑子里的词根本不是一个东西。
2026-03-29 10:20:38
51
原创 什么是 Harness Engineering?把 Prompt、Workflow、Eval 串成系统的那层骨架
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇我们先把问题抛出来了:为什么现在大家都在聊 Agent、Workflow、AI Coding,可真正决定系统上限的,往往不是模型本身,而是模型外那层工程骨架。这一篇就往前走一步。我们不聊热点,不聊某个项目又涨了多少星,先把最容易混淆的几个词讲清楚:▸Prompt▸Agent▸Workflow▸Eval▸Harness▸Product因为很多团队一开始就卡在这里。
2026-03-28 15:14:22
272
原创 AI Agent 爆火之后,为什么真正决定上限的是 Harness
如果你改了 Prompt、换了模型、加了工具、改了 workflow,最后系统到底变好了,还是只是某几个 case 看起来更顺了?没有 eval,很难说清。gstack 的价值,不只是“多角色”,而是它把 AI Coding 组织成了一个可执行流程。真正难的不是让模型做一件事,而是让模型按流程、按边界、按质量要求持续做事。Agent 一旦从“回答问题”升级到“实际做事”,风险也跟着上来了。很多系统不是“模型不会”,而是“外面的工程壳没搭好”。这已经不是“模型聪不聪明”的问题了,而是系统治理问题。
2026-03-27 09:40:27
258
原创 Prompt Engineering 进阶:System Prompt 设计模式与 Few-Shot 策略
主题核心要点适用场景角色扮演给模型一个明确的专家身份所有场景的基础规则约束正面 + 负面双重约束需要控制边界的场景输出格式JSON + Zod 运行时校验需要程序化消费输出知识注入在 System Prompt 塞入私有知识项目特定规范、API 文档Few-Shot3~5 个多样化示例格式要求高、分类任务动态 Few-Shot向量相似度选择示例大型示例库、RAG 场景CoT让模型展示推理过程逻辑推理、Bug 诊断链式调用大任务拆成小步骤复杂的多步骤任务。
2026-03-26 10:12:51
522
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
562
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
581
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
275
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
254
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
523
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
488
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
550
原创 CLAUDE.md 实战:让 AI 记住你整个项目的“潜规则“
简单说,CLAUDE.md就是你给 AI 写的一份项目入职手册。想象一下,一个新同事入职第一天,你会怎么带他?"我们项目用 React + TypeScript,状态管理用 Zustand,样式方案是 Tailwind,包管理器用 pnpm。代码提交前跑。组件命名用 PascalCase,文件名用 kebab-case。我们的 API 全走/api/v2前缀,鉴权用 JWT。有问题先看docs/目录。你不可能每次带新人都从头讲一遍吧?写成文档,放在那,人来了自己看就行。CLAUDE.md。
2026-03-25 09:45:36
524
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅