自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 我给 AI Agent 加上 Function Calling,3 次翻车后总结出 4 个致命坑

坑症状解法Schema 模糊Agent 传奇怪参数description 写清格式/范围/禁止项关键词埋深该用的工具不用前 10 个 token 点明功能无轮数限制死循环烧 Tokenmax_turns + 终止条件返回不压缩上下文溢出,开始编数据超 20 行就摘要这 4 个坑都不是模型问题,是工程问题。Function Calling 本质上是一个「约束越多,效果越好」的系统——你给的说明书越精确,Agent 就越靠谱。

2026-06-16 09:33:45 265

原创 MCP 协议从零到实战:接上 4 个开源 Server,我的 AI 助手终于能直接操作文件了

MCP(Model Context Protocol)是 Anthropic 推出的开放协议,本质是一个标准化的"AI ↔ 工具"接口。Server:封装一个工具(文件系统 / 数据库 / API)Client:AI 助手(Claude Desktop / Hermes Agent / Continue)Transport:通信方式(stdio 管道 或 HTTP)一个 MCP Server 就是一个本地进程,AI 通过 stdio 向它发 JSON-RPC 请求,Server 执行操作并返回结果。

2026-06-15 14:30:38 318

原创 AI Agent 跑了一个月,我统计出 4 种最常见的静默失败——第 3 种让任务成功率腰斩

静默失败类型根因一句话解法1输出截断stdout 硬上限输出末尾加完整性标记2幽灵进程无互斥锁flock排他锁3Prompt 稀释上下文累积4环境漂移变量泄漏每个 cron 开头unset+ 显式 set这 4 条规则花了我 200+ 个失败任务才总结出来。如果你也在跑 AI Agent 自动化,先查这 4 个坑——大概率至少中 2 个。📌 作者:Aliaoo🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。🖥️需要云服务器跑项目?👉。

2026-06-15 09:31:11 316

原创 我用 AI Agent 审查了 2000 行代码:揪出 14 个隐藏 Bug,但代价是 23 次误报

AI 代码审查能抓到人类容易漏掉的逻辑错误和边界条件 bug,但误报率高得离谱——每查出 1 个真 Bug 就附带 1.6 次假警报。关键不是「要不要用」,而是「怎么用才能不让假警报淹没真问题」。上个月我在一个数据清洗项目里改了一段 200 多行的 SQL,改了 3 天没发现有个 WHERE 条件把 NULL 值全过滤掉了——直到数据跑出来少了 40% 才意识到。那一刻我决定:让 AI 当代码审查的二审官。但问题来了:AI 审代码到底靠不靠谱?

2026-06-12 09:31:02 321

原创 Scrapling 实测:GitHub 60K 星的新爬虫框架,5 行代码爬了 500 条数据,比 BeautifulSoup 快 784 倍

BeautifulSoup 解析 5000 个 HTML 元素要 1.5 秒——Scrapling 只需要。这可不是营销号吹的数字,是 GitHub README 里实测跑出来的 benchmark。我花了 30 分钟上手,一句话总结:它不只是一个解析器,是把「爬虫该干的活」打包成了一个开箱即用的瑞士军刀。

2026-06-11 14:30:36 530

原创 我用 3 个 AI Agent 并行写代码,产出翻 3 倍——但第一天就踩了 5 个坑

上个月我的代码提交量涨了 3 倍,不是因为我突然变强了,是因为我开始让 3 个 AI Agent 同时干活。但说实话,第一周差点把项目搞崩。Claude Code 负责架构和重构,Codex CLI 写功能模块,OpenCode 跑测试修 Bug。听起来像个完美的流水线对吧?实际跑起来的第一天,三个 Agent 在同一个文件里互相覆盖对方的代码,Git 冲突比我的 commit 还多。

2026-06-11 09:30:57 222

原创 微软甩出5个自研模型:Build 2026 的3组数字,暴露了 Copilot 的底牌

微软 Build 2026 大会开完两天了。大部分媒体在报"微软发布首个自研推理模型",标题一个比一个大——但我觉得真正值得开发者关心的,不是微软又发了什么,而是。我梳理了本次 Build 大会公布的 3 组关键数字。看完你大概能判断:你每个月掏的 Copilot 订阅费,未来流向的是 OpenAI 还是微软自己。

2026-06-10 14:31:17 566

原创 跑了30天AI Agent自动化,我遇到了3种Token爆炸的场景(附解决方案)

最好的策略是在工具输出进入上下文之前就做截断和摘要——而不是等上下文满了再事后补救。# 工具输出的"双通道"模式@tool# 返回摘要而非全文return {"summary": f"文件。

2026-06-10 09:31:26 726

原创 Copilot 改按量后我决定换掉它:用 3 个免费工具跑同一个项目,月成本从 $746 降到 ¥4.7

6 月 1 日早上,我打开 GitHub 看了一眼 Copilot 的账单预估——如果我保持原来的使用习惯,月费会从 $10 跳到大约 $400。Reddit 上有人更惨,$28 变 $746。我当时就决定:换了。

2026-06-09 14:30:39 310

原创 GitHub Copilot 改按量计费 72 小时:$28→$746 的账单、暂停新注册,以及这对普通开发者意味着什么

6 月 1 日,GitHub Copilot 正式从「请求次数计费」切到了「Token 用量计费」。我在 Reddit 上看到的第一条开发者反馈,是一张账单对比截图——。26 倍的差距。这不是个例。Ars Technica 报道称,大量开发者在计费切换后「经历了极端的价格冲击」。有人第一天就用光了月度预算。有人发现 Copilot 甚至——你现在去 GitHub Copilot 页面,只能看到「New sign-ups remain paused」的提示。

2026-06-09 09:30:50 230

原创 我写了 3 版 CLAUDE.md,AI Agent 的代码通过率从 30% 跳到了 85%

上个月我用 Claude Code 重构一个 Python 项目,每次让 AI 改代码,改完就跑不通——不是 import 路径错,就是 API 签名对不上,要么直接用了项目里根本不存在的函数。30% 的改动能一次跑通,剩下 70% 我得手动修。我一度觉得 AI 编程也就这样了——直到我认真写了一版 CLAUDE.md。三个月过去,我的 CLAUDE.md 迭代了三版,代码一次通过率从 30% 爬到了 85%。这篇文章把每一版改了什么、为什么改、效果差在哪,全拆开给你看。

2026-06-08 19:55:27 603

原创 GitHub 今日第一:压缩 60%-95% Token 还保质量,headroom 让你的 LLM API 账单直接腰斩

headroom 是目前最简单、效果最好的 Token 压缩方案——一行命令接入,压缩 60%-95%,benchmark 质量不变,本地运行,数据不出机器。如果你每个月 LLM API 账单超过 $20,装一个 headroom 大概率能把成本砍半——而且不用改任何已有代码。开源地址:https://github.com/chopratejas/headroom📌 作者:Aliaoo🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。🖥️需要云服务器跑项目?👉。

2026-06-05 14:30:52 547

原创 MiniMax M3 发布 3 天,SWE-Bench 超越 GPT-5.5:国产大模型首次三项全能,附 API 实测

2026 年 6 月 1 日,MiniMax 悄悄扔了一颗炸弹——M3 模型。这颗炸弹有多响?SWE-Bench Pro 编程评测,直接超过 GPT-5.5 和 Gemini 3.1 Pro,逼近 Claude Opus 4.7;BrowseComp 浏览器信息检索,把 Opus 4.7(79.3)甩在身后;原生支持,而且是的,不是后期打补丁嫁接的。说人话:这是国产大模型历史上,第一次同时把「前沿编程能力 + 超长上下文 + 原生多模态」三件事搞定在一个模型里。

2026-06-05 09:30:47 764

原创 OpenWork 从零上手:开源版 Claude Cowork,10 分钟拥有桌面 AI 同事

OpenWork 不是 Claude Cowork 的完美替代——还没到那个程度。把「桌面 AI Agent」这件事从订阅制变成了开源 + 本地运行。你的文件不会离开你的电脑你可以用自己的 API Key,成本可控你可以改代码、加功能、接自己的模型GitHub 地址:github.com/different-ai/openwork,MIT 协议,放心用。你用上桌面 AI 助手了吗?是 Claude Cowork、OpenWork、还是别的工具?评论区聊聊体验 👇📌 作者:Aliaoo。

2026-06-04 14:31:04 595

原创 WebMCP 从零上手:Google 刚推出的 AI Agent 网页标准,以后网站不用“看“了,直接“调“

WebMCP 解决了一个很实在的问题:AI Agent 越来越多,但网页还是给人类设计的。通过让网页暴露结构化工具,Agent 不再需要"看"网页——直接调函数,快、准、不怕改版。Chrome 149 Origin Trial 开放,大厂已经在实验。现在学,等标准落地你就是第一批能用的开发者。你用 AI Agent 操作过网页吗?有没有被"点不到按钮"逼疯过?评论区聊聊。📌 作者:Aliaoo🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。🖥️需要云服务器跑项目?👉。

2026-06-04 10:14:54 503

原创 OpenCode:166K 星的开源 AI 编程 Agent,一天涨 1000 星凭什么?

一行命令安装,终端原生,不切窗口MIT 开源,166K 星,914 贡献者,项目活跃不锁模型,DeepSeek 随便接,不加价两个 Agent 模式,build 干活 plan 分析装一个试试。把第一个 prompt 换成你手头最不想干的脏活——改命名、加类型注解、统一日志格式——看看它 30 秒能干完你半小时的活。📌 作者:Aliaoo🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。🖥️需要云服务器跑项目?👉CSDN 开发云常年折扣,新用户首单特惠。

2026-06-03 14:30:41 584

原创 黄仁勋 GTC 一锤定音:Agentic AI 已来,普通程序员怎么办?

不是新显卡,不是新架构——是。他说:AI 从「生成式」进化到了「代理式」。一个字的差别,够整个软件行业消化三年。

2026-06-03 10:08:40 403

原创 MOSS-TTS 开源语音合成实战:复旦团队出品,3 秒音频就能生成专属语音

MOSS-TTS 是目前开源 TTS 领域最有诚意的项目之一。效果真的能打。不是那种「开源项目嘛,效果差不多就行」的水平。中文语音合成质量已经非常接近商业产品(比如讯飞、腾讯云的 TTS)。3 秒声音复刻是杀手级功能。这个门槛低到离谱——你甚至可以用手机录一段语音发过去,就能生成自己的 AI 声音。Apache 2.0 协议,可以商用。这意味着你可以把它集成到自己的产品里,不需要担心版权问题。有轻量版本。Nano 版只有 0.1B 参数,CPU 可跑。这意味着即使是最简单的硬件也能用。

2026-06-02 15:27:05 399

原创 crawl4ai 从零到上手:GitHub 排名第一的开源 AI 爬虫,5 行代码抓取任意网页

用 crawl4ai 之前,我写一个「抓网页 → 清理 → 喂给 LLM」的流程至少几十行代码,还得处理各种边界情况。result = await crawler.arun(url="目标网址")print(result.markdown) # 直接给 LLM如果你在做 RAG 项目、AI Agent 开发、或者经常需要把网页内容丢给 ChatGPT 分析,这个工具值得加到你的工具箱里。GitHub 地址:https://github.com/unclecode/crawl4ai。

2026-06-02 09:31:38 532

原创 200行Python代码,让程序自己会干活——手写一个AI Agent

先说清楚概念。你平时用大模型,大概率是这个流程:发一条消息 → 模型回一条消息 → 结束。这叫"单轮对话",模型就是个高级问答机。但 Agent 不一样。Agent 的核心是“自主循环”:模型不只是回答问题,而是自己判断接下来该干什么——要不要查资料?要不要算个数?要不要读写文件?——然后动手去干,干完再根据结果决定下一步。普通 LLM 像一个图书馆管理员,你问什么他答什么Agent 像一个实习生,你跟他说"帮我整理这周的日报",他会自己去翻文件、读内容、写总结、保存结果。

2026-06-01 11:21:15 488

原创 Perplexity Bumblebee 从零上手:刚开源 3 天,给你的开发机做一次安全体检

你知道自己电脑上到底装了哪些第三方代码吗?大多数开发者的回答是「大概知道」,而 Bumblebee 能把「大概」变成「确定」。从安全角度来看,这是供应链安全向「开发者端点」延伸的一个标志。以前大家只关心服务器和 CI 管道,现在连开发者的笔记本电脑也要纳入安全视野了。建议你现在就跑一遍,看看扫描结果里有没有让你意外的发现。我赌大概率有。📌 作者:Aliaoo🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。🖥️需要云服务器跑项目?👉CSDN 开发云常年折扣,新用户首单特惠。

2026-05-29 14:31:05 568

原创 Gemini 3.5 Flash 开发者实战指南:比上一代快 4 倍,免费 API 就能跑

Agent 化。Gemini 3.5 Flash 不再只是一个「聊天机器人」,而是一个能调用工具、执行代码、搜索网络的自主工作单元。对个人开发者来说,最实在的好处是:以前你要搭 LangChain 或者自己写 Agent 框架才能实现的功能,现在 Gemini 3.5 Flash 原生就支持,几行代码就能跑起来。

2026-05-29 09:31:31 496

原创 AI开发工具实战:七、一个完整的 AI 开发工作流(系列总结)

五篇文章过去了。这篇用一个真实例子,把整个系列串起来。

2026-05-28 14:31:10 512

原创 AI开发工具实战:六、Claude Code vs Codex vs Cursor——多工具横评

系列前四篇都在讲 Claude Code。但很多读者问:Codex 和 Cursor 也很火,到底选哪个?这篇横评帮你决策。

2026-05-28 09:38:51 596 1

原创 AI开发工具实战:五、Cursor 实战——让 AI 帮你写代码的正确打开方式

接到需求│├─ 不确定怎么做 → Ask Mode 问清楚│├─ 复杂需求 → Plan Mode 出方案 → 你对齐理解│└─ 开始写代码│├─ 小改动 → Cmd+K├─ 模板代码 → 写注释 → Tab 补全├─ 跨文件改动 → Agent Mode├─ 出 bug → Debug Mode└─ 不确定新 API 用法 → MCP 联网查这套流程跑了半年,最直观的变化是:以前遇到一个新模块,我习惯先打开浏览器搜"xxx 教程",现在习惯先在 Cursor 里 Ask 一下。

2026-05-27 14:30:33 539 1

原创 我靠 DeepSeek API 省下大量时间:3 个自动化场景实战

别把 DeepSeek 当万能药。它擅长的是"有明确规则的重复性任务"和"基于给定信息的归纳推理"。涉及业务决策、架构设计、安全漏洞的最终判断——你需要自己拿主意。AI 给你的终究是一个"建议",不是"结论"。我的原则很简单:让 AI 做"量"上的事(扫几百行代码、读几千行日志),人做"质"上的判断(这个改动要不要合、这个告警要不要处理、这句话说出去会不会被人喷)。两个配合起来,效率确实翻倍。如果你也有类似的自动化场景在用,欢迎在评论区分享——说不定我们还能互相抄抄作业。📌 作者:Aliaoo。

2026-05-27 09:31:27 639

原创 AI开发工具实战:四、AI 辅助自动化部署——从代码到上线一个指令

前三篇讲了写代码,这篇讲"写完代码之后的事"——部署上线。AI 能做的远不止写代码。

2026-05-26 14:31:04 466

原创 AI开发工具实战:三、AI 编程的正确姿势——定规格,不写代码

前两篇讲了 Claude Code 入门和 Superpowers 工作流。

2026-05-26 09:55:51 425

原创 DeepSeek Function Calling 实战:让大模型学会「调用工具」

Function Calling 的价值不在于"让模型变聪明",而在于打破模型和现实世界之间的墙。查询数据库(而不是只靠训练数据猜)调用第三方 API(天气、新闻、物流)操作文件系统(读、写、搜索)触发业务流程(发邮件、下单、审批)DeepSeek V4 的 Function Calling 兼容 OpenAI 格式,迁移成本几乎为零。配合严格的 JSON Schema 校验和极低的调用成本,是目前做应用开发非常实惠的选择。

2026-05-25 15:06:46 350

原创 AI开发工具实战:二、Superpowers 工作流——让你的 AI 编码助手开挂

上篇讲了 Claude Code 入门,这篇说一个能把它从"好用"推到"开挂"的东西——Superpowers。

2026-05-25 09:09:42 314

原创 AI开发工具实战:一、Claude Code 入门:从安装到第一个项目的完整指南

如果你还没用过 Claude Code,这篇文章就是写给你的。不讲理论,直接装好跑起来。

2026-05-22 09:33:57 575

原创 2026年5月GitHub最火的5个AI开源项目——个个都是20万星级别

5月的GitHub Trending被AI项目包场了。说实话,我已经很久没见过这种盛况——同一个分类下同时有5个项目日涨星过千。这篇文章带你看一遍,省得你一个个翻了。

2026-05-21 15:45:06 2214

原创 30 行代码搞定!用 Python + DeepSeek API 打造自己的命令行翻译工具

三十多行 Python 代码,一个下午,搞定了一个日常高频需求。核心就两步:用 OpenAI SDK 连 DeepSeek API,写好 System Prompt 控制输出格式。这个思路不限于翻译——代码审查、日志分析、文档生成,换个 Prompt 就能干别的。API 就在那,关键是找到适合自己的场景。代码放在这,拿回去改改用吧。

2026-05-21 09:31:01 576

原创 OpenHuman 从零到上手(2026年5月最新版)

OpenHuman 是 2026 年 AI 进化三部曲的第三部。从 OpenClaw(工具)到 Hermes(学习)到 OpenHuman(理解),每一代都在降低门槛。如果你之前因为养龙虾太复杂而放弃,这个可以试试。安装 2 分钟,连接账号 2 分钟,等同步 3 分钟——总共不到 10 分钟就能体验一个懂你的 AI。项目地址:github.com/tinyhumansai/openhuman当前版本:v0.54.0发布日期:2026-05-19。

2026-05-20 14:21:32 1964

原创 阿里云 ECS 部署 Python Flask 项目:从零到上线完整指南

花了一整天踩完所有坑,写了这份指南。面向新手,每一步都有解释,跟着操作就能上线。

2026-05-20 09:31:22 575

原创 DeepSeek API 接入完整避坑指南:从注册到第一个 AI 应用

2026 年 5 月,DeepSeek V4 发布刚满一个月。本文记录我从零接入 DeepSeek API 的全过程,含完整代码、踩坑记录和成本实测。

2026-05-19 20:43:40 1890

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除