- 博客(2152)
- 收藏
- 关注
原创 用户为什么不信任你的 AI 产品?问题出在前端
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群不是"不好用",是"不敢用"。一个 Agent 帮你改了 5 个文件,你敢直接合并吗?一个 AI 助手给了你一份分析报告,你敢直接转发给老板吗?一个自动化工具说"我已经帮你发了邮件",你心里慌不慌?模型再聪明,如果用户看不到它在干什么、不知道它为什么这样做、无法在关键时刻叫停——信任就建立不起来。这就是今天想聊的主题:在 Harness Engineering 的视角下,
2026-04-18 10:31:37
303
原创 会 AI 的开发者收入翻倍,这 6 个方向最值钱
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群2026 年 2 月,全球最大的自由职业平台 Upwork(纳斯达克:UPWK)发布了第六份年度《In-Demand Skills》报告。这意味着什么?不是"AI 要取代你",而是"会 AI 的人正在吃两份饭"。
2026-04-18 10:31:37
210
原创 AI 出了问题你连日志都没有?聊聊 Agent 可观测性
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前面几篇聊了怎么评测(14)、怎么做验收清单(15)、怎么加 Guardrail(16)。传统后端系统有完善的日志、监控、链路追踪。一个请求 500 了,你能从 Grafana 看到是哪个服务挂了、从 Jaeger 追到是哪个调用超时了、从 ELK 翻到具体的错误日志。但 Agent 系统呢?模型推理了 5 轮、调了 3 个工具、中间还触发了一次重试——这就是可观测性(Observability)要解决的事。
2026-04-16 09:23:58
9
原创 Agent 动了你的数据库?聊聊工具权限这件要命的事
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Schema 怎么写模型才看得懂。举个真实场景:你做了一个内部知识库 Agent,接了数据库读写工具。某天一个用户问了句"帮我清理一下过期的笔记",Agent 很贴心地调了,把 300 条笔记全删了。参数格式完全正确,Schema 设计也没问题——07 篇讲 4 层防护的时候,权限检查只占了一小节。
2026-04-15 09:55:30
14
原创 OpenAI 要做超级应用了
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群OpenAI 最近搞了个大动作——把 ChatGPT、Codex 和一个叫 Atlas 的 AI 浏览器,打包成了一个桌面端"超级应用"。第一反应是:这不就是 AI 界的微信吗?把聊天、工具、浏览器全塞进一个 App 里。但仔细看完细节之后,我觉得这件事比"产品整合"要深刻得多。这个转变对开发者来说,影响可能比 GPT-5 本身还大。
2026-04-15 09:55:30
514
原创 Cursor 之后,我又找到一个更能打的
最近跟几个朋友聊到 AI 编程工具,大家的反馈出的一致:"Cursor 是好用,但最后还是我自己在 review、在拆任务、在想架构。而且它的沙箱隔离做得很到位:每次任务都是全新的虚拟环境,AI 的所有操作都在沙箱里进行,任务结束环境就销毁。说实话,现在大部分 AI 编程产品走的都是"闭源 SaaS"路线——你只能用,不能看里面怎么实现的,更别提提意见了。MonkeyCode 让我看到了另一种可能:AI 不只是帮你敲键盘的工具,而是一个能参与需求分析、技术设计、代码开发、Review 全流程的研发角色。
2026-04-14 09:29:09
480
原创 Agent 差点把生产环境搞挂?Guardrail 不是可选项
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了上线前的验收清单。。这一篇就把 Guardrail 拆透。Guardrail 不是一个产品名,也不是某个框架的功能。你可以把它理解成 Agent 的"安检门"——不是不让 Agent 做事,而是确保它做的每件事都在你画好的线内。
2026-04-13 10:03:08
10
原创 Anthropic 放出最强模型但不让你用:Claude Mythos 和它发现的数千个零日漏洞
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群说实话,我追 AI 新闻这么久,很少有哪个发布让我觉得"世界线真的变了"。但这次 Anthropic 搞的,我看完官方页面之后愣了好一会儿。不是因为又刷榜了——虽然确实刷了,而且刷得很恐怖。
2026-04-13 10:03:08
491
原创 Gemma 4 发布:开源模型终于能在浏览器里跑 Agent 了
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群说实话,开源模型发布已经不算新闻了。每个月都有新模型出来,benchmark 一个比一个好看。但 Gemma 4 有几个点让我觉得确实值得聊一聊——不是因为它"最强",而是因为它可能是,而且落地路径对前端开发者来说特别友好。
2026-04-10 09:08:05
575
原创 AI 上线前的验收清单,你可能一条都没做
你的 Agent 效果很好,但日志没有,出了事找不到原因——不能上线。权限没收,Agent 能直接改数据库——不能上线。没有 kill switch,跑飞了停不下来——不能上线。上一篇讲了 Eval——怎么判断你的 AI 是变好了还是变差了。但 Eval 告诉你的是"好不好",不是"能不能放出去"。这一篇就把上线前该检查的东西拉一个清单。不是什么"最佳实践理论",而是。,加入前端Q技术交流群。
2026-04-10 09:08:05
21
原创 你的 AI 改了 3 版,到底有没有变好?
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群。前面四个模块解决了"给模型看什么"(Context)、"让模型怎么动手"(Tool)、"多步怎么协调"(Workflow)。说实话,大部分做 AI 产品的团队在这个问题上是靠"感觉"的。改了 Prompt,跑两个 case 看看,觉得"好像还行"就上线了。直到有一天用户反馈"以前能答对的问题现在答不对了",才发现改坏了。这就是 Eval(评测)要解决的问题。
2026-04-09 10:07:08
20
原创 OMC 爆火:给 Claude Code 装上多智能体编排,效率翻 3-5 倍
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群(简称 OMC)。第一眼看名字就知道灵感来源——就像 oh-my-zsh 让终端开箱即用一样,OMC 的目标是让 Claude Code 从"一个 AI 助手"变成"一支 AI 团队"。不是那种"装了锦上添花"的东西,而是会实质性改变你用 Claude Code 方式的工具。
2026-04-09 10:07:08
588
原创 从 gstack 爆火看趋势:AI Coding 正在变成流水线
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前三篇讲了 Workflow Harness 的三个核心机制:状态机、循环防护、Checkpoint。这一篇换个角度——看看 Workflow Harness 在真实产品里是怎么落地的。最近最火的案例就是。Y Combinator 的 CEO Garry Tan 开源了一套 Claude Code 工作流系统,号称一个人用 AI 每天写 1 万到 2 万行生产代码,60 天写了 60 万行(其中 35% 是测试)。
2026-04-08 09:48:04
36
原创 Cursor 3 正式发布:从代码编辑器到 Agent 调度中心
之前 AI 做后端逻辑很强,但做 UI 经常"对不上"——你说"按钮间距大了",AI 不知道你说的是哪个按钮。现在可以直接指给它看,这对前端 CSS 调试的效率提升是量级的。
2026-04-08 09:48:04
504
原创 AI 任务做到一半崩了怎么办?Checkpoint 救命指南
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了循环防护,解决了"Agent 跑不停"的问题。网络抖动、API 限流、服务器重启、用户刷新页面——任何一个都可能让一个跑了 30 秒、消耗了 2 万 token 的 Workflow 瞬间归零。然后呢?从头再来。用户等两遍,token 花两遍。Checkpoint(检查点)就是解决这个问题的。
2026-04-07 09:48:56
42
原创 2026 年用 AI 赚钱的 5 条真实路径,哪条适合开发者?
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群如果你想系统地学习AI,推荐一波我的2个合集,和。这几个月 AI 赚钱的信息太多了,小红书刷三屏有两屏在教你月入过万。我自己研究了其中几条路,说几句真话——大部分"被动收入"叙事都是卖课前置。但确实有几条路是的。我按自己的判断,把它们分成了 5 条,从最适合开发者的讲到最不推荐的。先放一张总览表,后面逐条展开聊。
2026-04-07 09:48:56
628
原创 Agent 为什么跑着跑着就死循环了
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了怎么给 Agent 加状态机。Agent 做"搜索 → 写稿 → 评审 → 不合格 → 重写 → 评审 → 又不合格 → 又重写...",无限循环下去,token 烧完了文章还没过审。这不是个例。只要你的 Workflow 里有回边(从后面的节点跳回前面),就有可能出现死循环。LangGraph 直接内置了参数,OpenAI 在 Agent 最佳实践里也专门提到了 max iterations —— 说明这是个行业公认的痛点。
2026-04-05 11:27:34
18
原创 一个前端开发者的 AI Agent 创业成本全拆解
权限怎么做、进度怎么展示、错误怎么让人类接管、怎么在客户现有系统里"像原生功能一样"出现、怎么让非技术用户也能配置 Agent 的行为——这些都是前端每天在处理的命题。很多纯后端的 Agent 创业团队,技术很强,但产品出来后用户一看:一个命令行界面、一坨 JSON 输出、没有任何交互引导。客户转身就走了。你会做产品壳、会做交互、会做"让人觉得靠谱"的界面,这不是锦上添花,这是。
2026-04-05 11:27:34
553
原创 单轮调用撑不住了?是时候给 Agent 加状态机
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群从这一篇开始进入 Harness 七层的第四层:Workflow Harness。前面两个模块解决了"给模型看什么"(Context Harness)和"让模型怎么动手"(Tool Harness)。你让 Agent 做一件复杂的事,比如"帮我调研 RAG 技术,整理成一篇文章",这不是一个工具调一次就能搞定的。它至少需要:搜索 → 筛选 → 阅读 → 整理 → 生成 → 检查。
2026-04-04 10:12:53
49
原创 Claude Code 源码泄露:51 万行代码暴露了 AI Agent 的完整设计哲学
我之前写过一篇上下文压缩的文章,当时还在想"实际产品里到底怎么做分级"。这次泄露直接给了答案。
2026-04-04 10:12:53
568
原创 你写的 Tool Schema,模型根本看不懂
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了工具不稳定的 4 个原因和 4 层防护。为什么说最根本?因为 schema 写得好不好,直接决定了模型在第一步就能不能正确理解你的工具。参数校验、重试、结果校验都是"出了错之后的补救",而好的 schema 是"从源头减少出错"。
2026-04-03 10:27:31
13
原创 你的 Agent 又调错工具了?4 层防护缺一不可
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群从这一篇开始进入 Harness 七层的第二层:Tool Harness。上下文管好了,模型知道该做什么了——但接下来它要"动手"。动手的方式就是调用工具(Tool Calling / Function Calling)。OpenAI 社区论坛上有大量开发者反馈 GPT-4o 的 function calling 失败率可以达到 30% 甚至更高。有人用官方示例测试,10 次调用只成功 3 次。
2026-04-02 10:55:36
290
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
45
原创 Pretext:前端文本布局的性能革命
维度说明是什么15KB 零依赖 TypeScript 文本布局库核心能力不碰 DOM 完成多行文本测量和布局性能比 DOM 方案快 300~500 倍,可在 120fps 下每帧调用作者适合聊天界面、AI 流式输出、瀑布流、编辑排版、虚拟滚动、文字动画不适合简单静态文本展示、不需要动态测量的场景状态2026.3 发布,MIT 开源,23000+ Star,API 可能还会演进Pretext 的意义不只是"快了 500 倍"。
2026-04-01 09:14:03
540
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
40
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
32
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
45
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
48
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
36
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
49
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
41
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
45
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
51
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
46
原创 别什么都往 System Prompt 里塞,AI 真的会“选择性失忆“
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Context Harness 的三层结构和核心原则。这一篇直接进入实操:每一层怎么设计,超预算了怎么办,以及为什么"全塞进去"是最糟糕的策略。
2026-04-01 09:14:03
38
原创 CDP 是什么:前端人应该知道的浏览器远程控制协议
作为前端开发者,理解 CDP 能帮你看懂 Puppeteer/Playwright 的设计,也能帮你在 AI 时代更好地做浏览器自动化。CDP 就是给这台车装了一套远程遥控系统——你不在车里,也能通过遥控器让车启动、转弯、停车、拍照。Puppeteer 底层就是 CDP,你用 Puppeteer 就是在用 CDP,只是不用自己拼 JSON。看到了吧——从你每天用的 DevTools,到 CI 里跑的 E2E 测试,到现在最火的 AI 浏览器自动化,现在,AI Agent 成了最大的新用户群。
2026-03-31 09:37:00
516
原创 Context Harness:别再把上下文一股脑塞给模型了
从这一篇开始,我们正式进入 Harness 七层结构的第一层:Context Harness。信息给错了,模型能力再强也白搭。信息给多了,模型反而容易迷路。这个"甜蜜区间"不是我编的,是实际工程里反复验证的经验。很多人以为,上下文窗口越大,就可以把所有信息都塞进去。Context Harness 的三层结构。给什么、给多少、什么时候给、什么时候收。模型只能根据它"看到的信息"做决策。不要无脑往里塞,要有策略地管。模型缺信息,容易猜、容易编造。信息过载,关键内容被"淹没"适中(40%-60%)
2026-03-31 09:37:00
19
原创 为什么 Demo 总能跑,系统却总是失控
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前三篇我们把概念框架搭好了。这一篇开始讲工程现实。如果你做过任何一个 AI 项目,大概率遇到过这种情况:Demo 阶段一切顺利,但一到真实环境,问题就像翻倍了一样冒出来。这不是偶然。Demo 和系统之间,天然存在 5 条断裂带。
2026-03-30 09:57:57
17
原创 Harness、Agent、Workflow、Framework:这些词到底怎么区分
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群前两篇我们已经把大框架搭起来了。第一篇讲的是:为什么现在值得聊 Harness。第二篇讲的是:Prompt、Agent、Workflow、Eval、Harness、Product 之间到底是什么关系。最常见的场景是这样的:▸别人说“我们要上 Agent”▸你理解成“要做一个复杂 Workflow”▸另一个人说“直接上 Framework 就行”▸最后你们讨论了半天,发现每个人脑子里的词根本不是一个东西。
2026-03-29 10:20:38
62
原创 什么是 Harness Engineering?把 Prompt、Workflow、Eval 串成系统的那层骨架
点击上方前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇我们先把问题抛出来了:为什么现在大家都在聊 Agent、Workflow、AI Coding,可真正决定系统上限的,往往不是模型本身,而是模型外那层工程骨架。这一篇就往前走一步。我们不聊热点,不聊某个项目又涨了多少星,先把最容易混淆的几个词讲清楚:▸Prompt▸Agent▸Workflow▸Eval▸Harness▸Product因为很多团队一开始就卡在这里。
2026-03-28 15:14:22
278
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅