自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 收藏
  • 关注

原创 Claude Code Plan Mode 实战:什么时候用、怎么退出、和 Fast Mode 的取舍

Plan Mode 的存在就是为这件事——在动手之前,让 Claude 先把要做的事完整说一遍,等你确认再开工。但很多人用 Plan Mode 用得很别扭,要么开了等于没开(Plan 本身就是糊弄过去),要么不该开的也开(小修改也跑一轮 Plan,效率反过来低)。more这篇文章不讲"Plan Mode 是什么"——这点官方文档已经够清楚。讲的是。

2026-06-14 13:49:53 369

原创 Claude Agent SDK vs Claude Code CLI:把 AI 嵌进自己应用前,先看怎么选

CLI 反而是负担——你不想要它的默认行为。

2026-06-14 13:47:23 468

原创 Managed Agents vs Claude Code:什么时候用托管 Agent,什么时候留在本地 CLI

Managed Agents 和 Claude Code 不是竞争关系,而是互补的工具。把长链路自动化、跨工具、需要人工确认的任务交给 Managed Agents;把项目级代码修改、交互式开发、严格上下文控制的任务保留在 Claude Code。真正的优化不是选一个工具用到底,而是理解每个任务的结构,匹配最合适的执行模式。

2026-06-13 12:44:55 108

原创 Claude Code Fast Mode 详解:适合哪些开发任务

Claude Code Fast Mode 是一个执行策略选项,不是一个“降级模式”。它适合边界清晰、规则明确、不需要验证的多轮任务;不适合需要项目规划、跨文件协作、结构分析和不熟悉场景的复杂变更。最好的用法不是始终选一个模式,而是在任务开始时判断它的结构类型,再决定要不要切过去。

2026-06-13 12:43:59 172

原创 2026 年 AI 搜索工具对比:Perplexity、ChatGPT Search 与 Gemini 怎么选

重要事实必须点开来源确认,特别是价格、版本、发布时间、政策和 API 限制。AI 搜索工具的最佳用法不是替代 Google,而是重构研究流程:先快速收集来源,再做结构化综合,最后回到原始来源验证。如果你需要快速找来源,用 Perplexity;如果你需要研究到写作一体化,用 ChatGPT Search;如果你处理长文档、多模态或 Google 生态资料,用 Gemini。真正高质量的工作流,通常是组合使用,而不是押注一个工具。

2026-06-12 08:30:05 641

原创 本地 LLM 生产部署实践:从 Ollama 到可维护架构

本地 LLM 生产部署的关键,不是把模型跑起来,而是把它纳入可靠的工程系统:有路由、有队列、有监控、有版本、有回滚。如果你的任务高频、稳定、隐私敏感,本地部署很值得;如果你追求最强模型能力或流量不稳定,云 API 仍然更简单。

2026-06-12 08:29:18 426

原创 2026 AI 技术趋势深度解析:世界模型、智能体与推理革命

世界模型:AI理解物理世界的关键一步智能体:连接技术与场景的核心载体推理:从"会做"到"会思考"的跃升效率:绿色、轻量化、端侧部署安全:从被动防御到主动治理对于开发者而言,2026年是学习和实践的黄金时期。无论是深入理解MCP协议构建智能体,还是掌握世界模型的应用,都将为职业发展带来巨大价值。技术的演进永不停歇,2026年的这些趋势不仅描绘了AI的未来图景,更为我们指明了学习和探索的方向。

2026-06-11 11:15:56 529

原创 2026年AI安全与治理:从幻觉到系统性欺骗的攻防之战

AI安全是一场持续的攻防之战。2026年的挑战更加复杂和隐蔽,但同时也推动了防御技术和治理框架的发展。只有通过技术创新、国际合作和多方协同,才能确保AI技术安全、可靠地服务于人类社会。安全不是一个功能,而是一种心态。在享受AI带来便利的同时,我们必须保持警惕,共同守护AI生态的安全。

2026-06-11 11:14:14 241

原创 Claude Code Skills 推荐:GitHub Stars 最高的 10 个项目

这份榜单里,superpowers、ECC、andrej-karpathy-skills 更适合学习工作流和行为约束;anthropics/skills 适合学习标准结构;ui-ux-pro-max-skill、graphify 更适合特定任务;awesome-claude-skills 更适合做资源索引。不要把 Claude Code Skills 当成“越多越强”。真正有效的做法是:用少量、清晰、可验证的 skill,让 Claude Code 在重复任务里少犯错、少废话、少跑偏。

2026-06-10 13:18:14 250

原创 AI 周报 | Claude Opus 4.8、Copilot Agent 和 Codex 工作流加速

把这些新闻连起来看,本周的主线不是某个模型单点升级,而是 AI 编程进入流程战。方向代表新闻对开发者的影响强模型长任务Claude Code 更适合复杂项目,但更需要边界和验收仓库级上下文AI 更懂项目,但仍要靠测试和审查验证Agent API 化团队可把 AI 任务接入内部平台CI 修复AI 开始进入构建失败处理,但不能跳过人工审查多模型入口模型选择变成工程策略沙箱执行工具调用开始走向可控执行环境跨角色工作流AI 编程从工程师扩到更多团队角色企业部署。

2026-06-10 12:59:17 614

原创 RAG 知识库问答效果差?先检查切块、召回和上下文污染

很多团队做 RAG 知识库问答,第一版效果差时会立刻换模型、换向量数据库、换 embedding。其实大多数问题不在模型,而在文档切块、召回策略、上下文拼接和答案校验。模型只是最后一环,前面任何一步做错,最后都会表现成“模型胡说”。如果你的知识库问答经常答非所问、找不到资料、引用错文档、或者回答看起来很自信但和原文不一致,先不要急着调 prompt。按下面这个流程查。

2026-06-09 09:23:53 131

原创 MCP Server 接入 Claude Code 老是失败?从 stdio、路径和 JSON-RPC 开始排查

把 MCP Server 接到 Claude Code 的过程里,最容易让人困惑的不是 Server 写错了,而是 Server 能跑但工具不出现、Claude Code 说找不到 Server、或者工具列表显示为空。这类问题通常不是模型或客户端的问题,而是通信层、路径配置、stdout 污染或 JSON-RPC 协议没跑对。本文假设你已经写过 MCP Server 基础代码。如果你还没写过,可以先看。这里只讲接入时最常见的失败场景排查。

2026-06-09 09:22:25 303

原创 OpenAI Codex 扩到全工作流:AI 编程不再只是写代码

OpenAI 在 6 月初把 Codex 放到了一个更大的叙事里:不只是一个会写代码的模型,而是面向 every role、tool 和 workflow 的开发助手。这个变化比单纯发布一个新功能更值得关注,因为它说明 AI 编程工具正在从“帮开发者补代码”转向“参与整个软件交付流程”。如果你只把 Codex 理解成另一个代码生成器,就会低估这次方向变化。真正的信号是:AI 编程正在进入角色分工、工具链集成和工作流编排阶段。

2026-06-08 15:03:28 105

原创 Google I/O 2026 的 Agentic Gemini:开发者该看什么

Google I/O 2026 的 AI 叙事很明确:Gemini 不再只是一个聊天入口,而是在往 agentic Gemini 方向走。Google 官方 AI 页面把 Gemini App、Gemma、Google AI Studio、on-device AI、代码辅助和 Agents 放在同一个开发者生态里,这说明 Google 想做的不只是模型能力展示,而是把 AI 放进更多产品、设备和开发流程。对开发者来说,这类发布最容易被误读成“又一个模型变强了”。

2026-06-08 15:02:35 193

原创 本地 AI Agent 又热了:Gemma 4 和 Gemini CLI 能跑开发工作流吗

本地 AI Agent 这件事又热起来了。Google 最近围绕 Gemma 4、Gemini CLI、本地 agentic workflows 和端侧 AI 工具连续释放信号,核心方向很明确:不要把所有开发任务都放到云端模型和在线 IDE 里,本地机器也应该能跑一部分 Agent 工作流。这个方向很诱人。开发者最关心的几个问题都被它击中了:代码隐私、调用成本、网络依赖、响应速度,以及能不能把模型接到自己的文件、终端和工具链里。

2026-06-07 13:53:06 167

原创 Copilot Agent Tasks API 开放:AI 编程开始进入后台任务时代

Copilot Agent Tasks API 的重点不在于“Copilot 又多了一个接口”,而在于 AI 编程工具的产品形态正在变化:以前它主要待在编辑器里,等你提问、补全、解释代码;现在它开始变成一个可以被系统调用的后台开发任务。这件事对开发者和团队都挺重要。因为一旦 AI 编程从聊天窗口变成 API,接下来要讨论的就不只是“它会不会写代码”,而是“谁能启动它、它改了什么、怎么验证、失败了谁负责、能不能接到现有研发流程里”。

2026-06-07 13:51:57 244

原创 Claude Opus 4.8 发布:Claude Code 能不能接住复杂项目

Claude Opus 4.8 不是一个只适合看跑分的模型升级。对经常用 Claude Code 改真实项目的人来说,更值得关注的是两个变化:模型本身更擅长复杂编码和 Agent 任务,Claude Code 又开始强调 dynamic workflows,也就是面对大任务时不再只靠一次长提示硬扛。如果你之前用 Claude Code 的方式是“把需求丢进去,让它自己改完”,那 Opus 4.8 反而可能让问题更明显。

2026-06-07 13:50:43 1991

原创 Claude Code 怎么用:新手从安装到完成第一次改代码

Claude Code 怎么用,关键不是记住多少命令,而是建立正确流程:在项目根目录启动,先让它理解上下文,再给清楚的目标、范围和验收标准,修改后看 diff,并用真实命令验证。如果你只把它当聊天机器人,它最多帮你生成代码片段。如果你把它当项目协作开发者,它就能帮你完成从理解需求到验证交付的一整段流程。新手先从小任务练起,等你能稳定控制范围,再把更复杂的开发任务交给它。

2026-06-06 14:32:27 173

原创 智能体开发入门:用 Python 写出你的第一个 AI Agent

Agent 的核心能力是"能调用工具"。先写一个简单的工具函数,让 Agent 可以用它。这里用一个天气查询工具做示范。"""查询指定城市的当前天气"""try:params={"q": city, "appid": "你的API_KEY", "units": "metric"}return f"

2026-06-06 14:31:24 127

原创 OpenClaw 怎么用:让 Agent 读网页、查资料和控制浏览器

OpenClaw 不是一个“更会聊天的模型”,它更像是给 Agent 加了一双眼睛和一只手:能读网页,能搜索,必要时还能打开浏览器看页面。但你不能把它当成万能网页机器人。真正好用的方式,是先让它做轻量、只读、可复核的网页任务;等你知道它读得准、动作稳,再逐步把浏览器交互加进去。

2026-06-05 18:25:31 156

原创 OpenClaw 和 MCP 怎么接:把浏览器能力做成 Agent 可控工具

浏览器工具返回结果时,不要只返回一段总结。总结很舒服,但不好审计。你不知道它从哪里读到,也不知道哪些内容没读到。读到的字段。字段来自页面哪个区域。不确定或缺失的内容。"pricing": {"value": "未确认", "source": "not_visible"},},"价格表可能需要点击 monthly/yearly tab 才完整显示","页面没有显示更新时间"这个结构比“这个页面主要介绍了定价方案”有用得多。因为后续 Agent、脚本或人工都能继续处理它。

2026-06-05 18:24:29 1027

原创 Hermes、OpenClaw 和龙虾类 AI 项目:新工具怎么判断值不值得跟

Hermes、OpenClaw、龙虾这类新 AI 项目值得关注,但不应该只因为名字新、讨论多、演示酷就写成推荐。真正可靠的做法,是先确认项目类型,再回到一手来源,看它解决什么问题、能否跑通、边界是否清楚、失败路径是否可控、维护信号是否真实。对开发者来说,这套方法能避免把时间浪费在无法落地的 demo 上;对内容团队来说,它能把短期热点转成长期有价值的问题型文章。以后遇到新的 AI 工具或 Agent 项目,不要先问“它火不火”,先问“它是什么、解决什么、证据在哪里、我能不能复现”。

2026-06-04 14:13:40 138

原创 ChatGPT、Claude、Gemini 怎么分工:一张任务路由表

ChatGPT、Claude、Gemini 的核心差异,不应该被写成品牌争论。ChatGPT 适合快速发散和短任务,Claude 适合长文整理、结构收敛和复杂上下文,Gemini 适合 Google 生态资料入口和部分办公流。真正可靠的做法,是按任务拆分流程。你可以从一张路由表开始:资料入口交给搜索和 Gemini,长资料整理交给 Claude,发散候选交给 ChatGPT,真实代码执行交给开发工具,最终事实和交付质量由人工把关。这样 AI 工具才不会变成随机问答,而会变成可复用的工作系统。

2026-06-04 14:08:04 252

原创 为什么做 AI API 成本计算器:从 Claude 账单到上线预算

不要给整个产品写一个混合预算。功能例子预算方式实时问答客服、知识库问答按日活和每人请求数估算代码生成IDE 助手、自动修复按开发者人数和每日调用数估算文档总结长文档、会议纪要按文件数量和平均长度估算后台分析批量分类、离线摘要按任务批次和队列规模估算高阶推理审查、规划、复杂 Agent按触发比例估算功能拆开以后,你才知道哪些请求适合用低成本模型,哪些请求必须保留 Claude Sonnet、GPT 或更强模型。

2026-06-03 01:07:33 223

原创 MCP Server 实战:从协议到本地工具调用

MCP Server 实战不是把本机能力全部开放给模型,而是把真实项目中可重复、可验证、可限制的能力整理成工具。协议负责连接,SDK 负责实现,真正决定效果的是工具边界、输入输出、错误反馈、输出长度和权限范围。对开发者来说,最稳的路线是:先理解 MCP 协议,再用一个最小 stdio 闭环验证客户端连接,然后从只读工具开始,把本地文件、内容资产、项目状态或内部服务逐步接入 Agent 工作流。等工具调用稳定以后,再考虑更高风险的写入、命令和发布类能力。

2026-06-03 01:06:09 263

原创 Claude API 成本控制指南:调用预算、token 监控与降本策略

Claude API 成本控制不是财务收尾动作,而是 AI 应用设计的一部分。模型越强、上下文越长、输出越完整,越需要清楚的预算边界和监控证据。真正稳定的做法是:按功能拆预算,用真实 token 样本估算成本,按任务分层选择模型,记录缓存、重试和 fallback,再用告警和降级方案兜底。这样 Claude API 才能从 demo 进入长期可运营的产品,而不是在流量增长后变成一张无法解释的账单。

2026-06-02 14:43:31 373

原创 Claude Code 常见错误与排错清单:从上下文、权限到验证失败怎么处理

Claude Code 常见错误大多可以归结为三件事:上下文不清、边界过大、验证不足。真正稳定的 AI 编程流程,不是让模型永远不出错,而是在出错时能快速定位、最小修复、保留证据。把 Claude Code 当成协作开发者,你就需要像管理人类同事一样管理它:任务要清楚,影响面要明确,修改要可审查,验证要可复现。这样它才不是一个随机代码生成器,而是能进入真实项目交付链路的开发助手。

2026-06-02 14:42:07 466

原创 Claude Code vs Cursor:怎么选适合你的 AI 编程工具

Claude Code vs Cursor 不是简单的“哪个更强”。它们都能帮你写代码,但解决问题的入口不同:Cursor 更像一个带 AI 能力的 IDE,适合在编辑器里持续写、改、补;Claude Code 更像一个能读项目、跑命令、改文件、做验证的终端协作开发者,适合处理跨文件任务和完整交付流程。如果你已经在用 Cursor,再看 Claude Code 时,最容易误判的地方是把它当成另一个代码补全工具。

2026-06-01 13:47:44 455

原创 Claude Code Git 工作流:分支、提交与代码审查怎么配合

Claude Code Git 工作流的重点,不是让 AI 自动提交更多代码,而是让每一次 AI 辅助修改都能被人类开发者清楚审查、可靠验证、必要时安全回滚。很多人已经会让 Claude Code 写代码,但真正进入团队协作时,问题往往出在分支混乱、提交边界不清、验证记录不足和 review 成本过高。

2026-06-01 13:46:32 408

原创 Claude Code 实战工作流:从需求拆解到验证交付的完整流程

Claude Code 的核心价值,不是“替你写代码”,而是把一个真实开发任务从理解、拆解、修改、检查到验证串起来。你给的上下文越清楚,它越像可靠同事;你给的边界越模糊,它越像随机代码生成器。明确目标、范围和验收标准。先定位文件和影响面,不急着改。把大需求拆成 3-5 个任务。每次只改一个方向,禁止顺手重构。改完解释 diff 和风险点。跑到真实入口验证,而不是只看测试或构建。这样使用 Claude Code,效率提升不是来自某个神奇命令,而是来自更稳定的协作方式。

2026-05-31 01:01:51 182

原创 AI Agent 开发专题:从 ReAct、LangChain 到 MCP Server 的实战路线图

AI Agent 的想象空间很大,但开发时要反过来收敛:先判断是否需要 Agent,再定义最小工具集,然后建立状态、日志、权限和失败处理,最后才考虑框架、多 Agent 和复杂编排。Agent 不是“更强的聊天框”,而是一个由模型驱动、工具执行、状态约束、日志可追踪的任务系统。从这里继续深入,建议先完成一个小型 LangChain + Claude 工具调用 Demo,再把其中一个工具改造成 MCP Server。

2026-05-31 00:52:55 773

原创 Claude 大模型深度评测:从参数架构到实战边界

在技术选型日益精细化的今天,面对层出不穷的大语言模型,开发者往往陷入“参数迷思”。我们习惯于盯着参数量、训练数据规模这些硬指标,却忽略了模型在实际工作流中的真实表现。很多时候,一个看似轻量级的模型,如果在逻辑推理和代码辅助上足够敏锐,反而比那些臃肿的“巨无霸”更能提升开发效率。真正的考验不在于它背下了多少百科全书,而在于当你在深夜调试一段诡异的报错,或是需要梳理复杂业务逻辑时,它能否像一个经验丰富的搭档一样,给出切中肯綮的建议。这篇文章正是基于这种实战视角展开的。

2026-05-30 04:32:57 188

原创 Claude 教程专题:Claude Code、Claude API 与 Anthropic 生态学习路线

学习 Claude 最忌讳泛泛体验。不要只问它几个问题,也不要只看模型评测。更有效的方法是选一个真实工作流:让 Claude Code 修一个小 Bug,用 Claude API 改一个已有 OpenAI 调用,用 Prompt 模板生成结构化输出,或者让它帮你审查一段 AI 生成代码。一旦进入真实工作流,你会更快看到 Claude 的优势和边界:它擅长理解复杂上下文,但仍然需要清晰规则;它可以推进多步骤任务,但仍然需要验证;它能降低开发成本,但也可能制造新的审查成本。

2026-05-30 04:29:15 663

原创 AI 编程工具怎么选:Claude Code、Cursor、GitHub Copilot 与 Ollama 指南

AI 编程工具已经不再只是“按 Tab 补一行代码”。如果你正在比较 Claude Code、Cursor、GitHub Copilot、VS Code Copilot 和 Ollama,真正要判断的不是哪个名字最热,而是哪一种工具能接住你的开发场景:补全、对话、项目级 Agent、本地模型,还是团队代码审查。

2026-05-29 03:57:30 955 1

原创 AI 月报 | 5 月回顾:国产登顶、模型降价、Agent 爆发、人才大地震

2026 年 5 月可能是 AI 历史上最疯狂的一个月——国产模型登顶全球、大厂价格战升级、顶级人才大迁徙、Agent 从概念走向产品。。本文按 6 个维度回顾 5 月最重要的动态。

2026-05-29 03:54:44 955

原创 AI 生成代码怎么审查?从可运行到可维护的验收清单

AI 编程最大的价值是提速:更快写样板代码,更快生成测试草稿,更快解释陌生逻辑。但代码质量不能外包给 AI。一套可靠的 AI 生成代码验收流程,应该覆盖需求、边界、测试、安全、错误处理、架构一致性和可维护性。这样你才能既享受 AI 的速度,又不把技术债一起合并进代码库。工具会不断变化,今天是 Copilot、Cursor、Claude Code,明天可能是新的 AI IDE 或 Agent。但无论工具怎么变,代码上线前都要回答同一个问题:这段代码能不能被团队长期维护?

2026-05-28 03:04:08 241

原创 10 个 VS Code AI 插件推荐:代码补全、聊天与代码审查工具

选 VS Code AI 插件时,不要先问“哪个最强”,先问你到底要什么能力:补全、聊天、代码审查、本地模型、还是大型代码库理解。日常补全:GitHub Copilot 或 Codeium。开源和本地模型:Continue。测试和质量:Qodo / CodiumAI。大型代码库理解:Sourcegraph Cody。这样比盲目安装一堆 AI 插件更有效。插件装得越多,不一定效率越高;形态清楚、场景明确,才是 VS Code AI 工作流真正提效的关键。

2026-05-28 03:03:14 322

原创 Deepseek-V4-Flash 模型深度评测与实战指南

综合各项测试数据,如果您正在寻找一个能够胜任复杂代码开发、高精度逻辑推理以及长文档处理的模型,那么当前评测的这款模型无疑是首选。它特别适合用于构建企业级知识库、自动化编程助手、智能客服系统以及专业领域的咨询平台。对于那些对创意写作有极高要求,或者主要应用于简单闲聊的场景,或许可以考虑其他侧重于此的模型以节省成本。但对于大多数追求实效、稳定性和性价比的技术团队来说,这款模型提供了一个坚实的基座。它的出现,标志着大模型应用正从“尝鲜”走向“深耕”,让真正的智能化生产力触手可及。

2026-05-27 21:36:36 478

原创 从 GPT-5 到 Claude 4:API 迁移实战指南

如果你正在使用 OpenAI GPT-5 API 构建应用,你可能已经听说了 Anthropic Claude 4 系列(Opus 4.7 / Sonnet 4.6 / Haiku 4.5)在多项基准测试中取得领先。根据最新的评测数据,Claude 4 系列在代码生成、长文本理解和复杂推理方面均表现优异,价格还比 GPT-5 更亲民。本文将带你完成从 GPT-5 到 Claude 4 的完整迁移流程,包括代码改写、提示词适配和成本优化。

2026-05-27 01:34:59 416

原创 AI Agent 实战教程:LangChain + Claude 从零搭建智能客服机器人

AI Agent 这个词 2026 年听了太多遍,但真正动手写过一个的人并不多。这篇文章不讲概念,带你用 LangChain + Claude 从零搭一个能用的智能客服 Agent——能查订单状态、处理退换货申请、遇到解决不了的问题自动转人工。完整代码约 200 行,Python 环境即可运行。

2026-05-26 03:18:41 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除