- 博客(112)
- 资源 (1)
- 收藏
- 关注
原创 6 种常见 AI 编程协作方法总结
当其他领域的从业者仍在探索 AI 的能力及其协作方式时,大多数程序员已将 AI 深度融入其核心工作,并实现了高度规范化的协同模式。**AI 负责自动化编码任务,而人则可专注于更高层次的角色——如项目经理、系统设计师和软件架构师等**。本文将在“术”的层面总结我观察到的具体实践演变,在“道”的层面分享我对这一趋势的深层思考。
2025-09-30 14:57:36
1153
原创 如何从 0 到 1 开发企业级 AI 应用:步骤、框架与技巧
聚焦LangChain全家桶工具设计理念,深入探讨企业级AI应用构建方法。涵盖LangChain、LangGraph、LangSmith等核心工具,详解Agentic工作流、可观测性设计及AI工程化最佳实践。学习字节DeerFlow、谷歌Gemini等开源案例,掌握Pydantic 2与国产模型集成技巧。
2025-08-13 20:55:37
1158
原创 谷歌 DeepMind 创始人2025 年总结:通往 AGI,还差 4 块关键拼图!
Demis 回顾了 AI 从大语言模型向代理式 AI (Agentic AI) 的重心转移,重点阐述了 DeepMind 利用 AI 解决材料科学、可控核聚变等科学突破。他坦诚剖析了当前大模型参差不齐的智力表现,指出通往 AGI (通用人工智能) 仍需补齐规划、推理和在线学习等关键拼图,并强调了世界模型在理解物理现实中的核心地位。面对堪比工业革命十倍速的社会变革,Demis 探讨了后稀缺时代的经济重构、国际协作的紧迫性,以及他对计算极限与人类意识本质的终极哲学思考。
2026-01-23 17:08:42
586
原创 扣子 2.0 的 Skills 让我用上了真正的通用 Agent!
扣子 2.0 的意义在于,它不再仅仅是「能生成点东西」,而是能够交付「可以直接拿去用」的成品。在严肃的职场环境中,这种可靠性正是我敢于将任务放心托付的前提。
2026-01-23 17:07:54
864
原创 软件大师 Martin Fowler 谈 AI 对软件开发的影响
本文整理自软件工程大师 Martin Fowler 的访谈录。他认为 AI 是其职业生涯中最重大的技术变革,其核心影响在于让开发从确定性转向了非确定性。文中深入探讨了 AI 如何重塑重构、敏捷开发及软件架构等经典实践,并特别警告了氛围编程中存在的学习回路缺失风险。Fowler 建议开发者利用 AI 处理遗留代码理解和快速原型开发,但必须保持严谨的验证与测试。他强调,无论工具如何进化,沟通能力、对复杂业务的理解以及持续学习依然是优秀工程师的基石。
2025-12-30 14:35:32
970
原创 2025 年我亲手做了 8 个 AI 产品:2 个悄悄赚钱,2 个血亏 50 万,血泪复盘
得益于 AI 编程能力的突飞猛进,构建一款工具类产品的门槛极其低,产品的成功不是比拼 AI 模型能做什么,而是理解用户需要什么、信任什么,在技术供给过剩的背景下,除了产品自身的竞争力,如何建立有效的传播路径是每位开发者必须深思的命题:
2025-12-30 14:18:11
1235
原创 2025 年 AI 行业年度总结
全面复盘2025年AI领域的重大进展:从DeepSeek-R1到Gemini 3的模型突破,从提示词工程向上下文工程的范式转移,Claude Code与Manus代表的通用Agent路径分化,AI产品如何重新定义效率,以及企业AI转型面临的挑战与机遇。涵盖Agent架构演进、AI产品设计原则、企业转型实践等多个维度的深度观察。
2025-12-24 12:05:55
4652
2
原创 深入解析 Agent RFT:通过强化学习微调提升智能体性能
深入介绍了 Agent RFT (Agent Reinforcement Finetuning,智能体强化学习微调),传统的提示工程和任务优化有其局限性,而 Agent RFT 通过在训练过程中允许智能体调用外部工具并从中学习,从根本上改变了模型的权重。该技术依赖于一个自定义的奖励信号(Grader),引导智能体探索实现任务的最佳路径。Agent RFT 能够显著提升智能体在特定领域任务上的性能、提高工具使用效率,并大幅降低延迟,这在 FinQA 基准测试以及 Cognition 等客户的成功案例中得到了验
2025-11-24 10:23:16
93
原创 MCP 发布一周年回顾:从 17 个 SEP 看 MCP 协议如何重塑 AI Agent 生态
MCP(Model Context Protocol,模型上下文协议)1.0 版本规范预计于 2025 年 11 月 25 日正式发布,刚好一周年。过去一年中,MCP 从 Anthropic 发布的一项实验性规范,逐步发展为连接 AI Agent 与外部系统的标准协议。本文深入分析 1.0 版本中的17 个 SEP,探讨其在 MCP 架构、安全、能
2025-11-24 10:11:06
890
原创 谷歌 AI IDE Antigravity 系统提示词分析
Antigravity 系统提示词包括用户设定 (identity,user_information,user_rules),系统功能 (tool_calling,web_application_development,workflows,function_calls)和上下文管理(knowledge_discovery, persistent_context) 三大块 9 个部分,长度在 1 万 token 左右,使用 xml 标签进行区分(完整的提示词在[谷歌 AI IDE Antigravity 系统
2025-11-20 12:00:58
1321
原创 24 小时深度体验 Gemini 3:从生成式 UI 到 Antigravity 重构 AI 开发流程,看谷歌模型新突破
全面解析 Gemini 3 Pro 带来的三大能力提升:以 Visual Layout 与 Dynamic View 为代表的生成式 UI 能力、AI 编程工具 Antigravity 的底层机制与系统提示词解析,以及结合系统卡信息与研发团队观点对基础模型训练策略的观察。
2025-11-20 11:52:28
2074
原创 大厂集体押注 SDD!阿里、腾讯、亚马逊都在用的规范驱动开发,优势在哪?坑怎么避?
规范驱动开发(Spec-Driven Development,SDD)正成为 AI 编程中的新兴范式。本文深入探讨 SDD 的核心概念,将其划分为规范优先、规范锚定和规范即源码三个层次,分析该方法在实践中的优势与挑战,并审视其是否正在重演“模型驱动开发”(Model-Driven Development,MDD)的历史困境。
2025-11-18 10:51:40
1573
原创 如何构建数据驱动的 Agent 评估体系,解决生产环境 Agent 可靠性问题
当 Agent 应用从 Demo 走向真实生产环境,零星问题会演变为海量请求下的系统性挑战。本期播客 LangChain 联合创始人深度揭秘 LangSmith 最新推出的 Insights(洞察) 与 Thread Evals(线程评估) 功能设计思考,分享如何从海量的生产数据中自动发现有价值的模式,如何构建数据驱动的、系统性的质量保障体系,真正提升 Agent 在生产环境中的可靠性。
2025-11-18 10:51:23
728
原创 让 Agent 告别低效工具调用:用代码执行重构 MCP 工作流,节省 90% 的上下文开销
MCP 已成为 Agent 应用连接外部工具的标准,但**普遍采用的“直接工具调用”方法存在严重效率问题,即工具定义和中间结果会大量消耗宝贵的上下文窗口**。本文认为 Agent 应用应该转向“代码执行”模式:不直接调用工具,而是让 LLM 生成代码来与 MCP 服务器进行 API 交互。这种方式能更充分地利用 LLM 在编码方面的强大训练优势,极大降低 token 消耗,并实现更复杂、高效、私密和可持久化的工作流。
2025-11-14 10:16:49
1144
原创 年处理约 1.4 万亿美元:从支付基础设施到 ACP 协议,拆解 Stripe 如何搭建AI智能体经济的商业标准?
在这期播客中,Stripe(几乎所有出海产品都在用的全球性支付平台)的数据与 AI 负责人 Emily 深入探讨了 AI 如何从根本上重塑经济基础设施。AI 不仅在创造新的商业模式(如 Agent 服务商),也带来全新的经济挑战,特别是高昂的边际成本和新型欺诈。Stripe 正在通过扩展其反欺诈系统 (Radar)、**推出 Token Billing(按推理时 token 计费)** 等创新支付工具,以及与 OpenAI 联合发布 **ACP (Agentic Commerce Protocol,代理式电
2025-11-14 10:16:29
654
原创 Windsurf Codemaps 深度解析:重新定义 AI 时代的代码理解方式
当前主流的 AI 编程工具正引导开发者进入“Vibe 编码”(凭感觉编程)的误区,它们通过直接包办代码的阅读、思考和编写,增加了开发者与代码之间的隔阂。**这种模式对于低价值的重复性任务尚可接受,但对于定义真正工程能力的、困难且敏感的高价值工作而言,是完全不可接受的。
2025-11-07 21:59:22
1158
原创 2025 年的热门 AI 编程工具评测:Cursor、Claude Code、Codex、Lovable、v0 等
这是一篇关于 AI 编程工具的评测,由 Greg Isenberg 和 Mickey 对 2025 年的热门 AI 编程工具进行了排名和分析,他们讨论了这些工具对技术开发者和非技术构建者的适用性,并强调了选择工具时对团队和生态系统的信任的重要性。
2025-11-07 21:54:58
4949
8
原创 Anthropic 研究员亲述:用代码、MCP、Skills 构建高效 Claude 智能体的方法论 |Anthropic 播客
分享了从简单的“工作流”过渡到复杂的“多智能体系统”的实践经验,并深入探讨了如何通过代码、智能体技能 (Agent Skills)、模型控制处理器 (MCPs) 和工具 (Tools) 的最佳实践来构建更高效、更自主的 Claude 智能体
2025-11-04 16:04:10
982
原创 独家揭秘 6 位工程师的 AI 工作流:流程比工具更重要
在 AI 编码工具(如 Claude Code, Codex 等)日益强大的今天,高效的开发者不再依赖单一工具,而是进化出高度个性化、多工具编排的复杂工作流,未来的开发效率不仅取决于 AI 模型的能力,更取决于开发者如何围绕 AI 设计自己的工作系统,以平衡快速执行、深度探索和上下文管理,从而将 AI 的生产力真正释放出来。
2025-11-04 15:54:04
1057
原创 别再浪费时间刷AI文章了!我花1年筛选、被1000+人付费验证的周刊,今天免费公开,帮你省下90%无效阅读时间
本文将详细介绍《AI 落地周刊》的内容构成、所依赖的优质信息源,以及如何实现信息采集、打分筛选、过滤和邮件推送的全流程自动化。最后,我也会简要说明决定免费公开的思考过程。
2025-10-28 10:41:59
647
原创 AI 工作流工具终极对比:Agent Builder vs n8n/dify/coze,该怎么选?
本文详细介绍了使用OpenAI Agent Builder构建视频问答AI智能体的完整流程。文章首先对比了n8n、dify、coze等主流可视化AI工具的特点,然后重点解析了Agent Builder的11个核心节点功能,包括核心节点、工具节点、逻辑节点和数据节点。通过一个实际案例演示了从用户查询到结果返回的完整工作流构建过程,包括入口设置、输入验证、添加智能体节点和RAG向量存储等关键步骤。文章特别强调了Guardrail节点在生产环境中的重要性,以及如何配置MCP服务器与外部工具集成。该教程为开发
2025-10-28 10:31:31
736
原创 Claude 新功能 Skills 横空出世,比 MCP 更高效的 AI 增强方案!
Claude Skills(Skills)是 Anthropic 公司推出的一种新功能,可以让 AI 模型通过加载包含指令、脚本和资源的“Skills 文件夹”来提升特定任务的表现。Skills 只有在与任务相关时才会被调用,比如处理 Excel 文件或遵循品牌指南。Skills 的组成和优势Skills 本质上是一个 Markdown 文件,告诉 AI 如何完成某项任务,还可以附带额外文档和脚本。
2025-10-20 17:47:50
1490
原创 告别氛围编码!资深开发者都在用的 AI 开发高阶玩法—Vibe Engineering
在软件开发领域,AI 的出现带来了两种截然不同的开发方式。一种是“Vibe Coding”,这种方式快速、随意,完全依赖 AI 的提示来生成代码,开发者几乎不关心代码的实际运行机制。但这种开发方式存在局限性,因为它忽略了开发过程中的许多重要环节。
2025-10-20 17:22:33
372
原创 深度解析 ChatGPT 和 Claude 的记忆机制
ChatGPT 和 Claude 这两个最主流的 AI 助手,在记忆系统的设计上走了完全相反的路。一个选择了"无感知的全面记忆",另一个选择了"用户主导的按需回忆",这背后其实反映了一个更深层的问题:AI 到底该如何记住我们?今天想和大家分享一下我的发现,以及这背后透露出的产品哲学差异。
2025-09-30 14:48:03
814
原创 从 Cursor 到 Claude Code,告别 AI 编程工具 Agent 配置烦恼,下一代通用 Agent 规范语言 ASL 详解
本文将系统梳理 8 种主流 AI 编程工具的配置机制,深入分析当前各类编程 Agent 所采用的不同指令体系。在此基础上,引出 OpenAI 发起的编码 Agent 指引规范 —— [AGENTS.md](https://agents.md/ "AGENTS.md"),并尝试将其扩展至项目管理、设计、市场等非编码 Agent 领域,最终构建一种通用的 Agent 规范语言(Agent Specification Language,简称 ASL),实现各类 Agent 约束规则的自动化生成。
2025-08-28 09:58:59
1361
原创 从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值
深度解析AI编程两大模式:Vibe coding与专业辅助编程。探讨Cursor、Claude Code等工具如何改变开发流程,分享设计稿转代码等实战案例,揭示AI编程的未来趋势。
2025-08-13 21:42:14
735
原创 8 小时打磨的 AI 开发者日报,上线 3 天狂揽1000+ 精准用户!
如何打造一个专门面向开发者、汇总 AI 技术领域动态的日报,这篇文章向大家介绍日报的定位和实现过程。
2025-07-18 14:15:46
697
原创 如何构建构建一个AI驱动的通用爬虫
我最近开始研究网络爬虫,并且考虑到AI领域的一切发展,我认为尝试构建一个可以迭代导航网络直到找到它所寻找的内容的“通用”爬虫会很有趣。这是一个正在进行中的工作,但我想分享一下我目前的进展。
2024-06-18 22:42:42
1659
原创 只需30分钟,微调阿里 Qwen2-7B,搭建专属 AI 客服
LLaMA-Factory 在data文件夹中提供了多个训练数据集示例,支持alpaca或sharegpt格式,不过我这里使用的是自己提前导出来做过处理的自定义数据集。自定义数据集选用alpaca因为我只有标注后的问答对,所以只需要填充和output部分即可,下面是部分数据,保存为 bajigo.json,并上传到 LLaMA-Factory 的 data 目录下。"instruction": "我能建两份菜单然后自行切换吗","output": "你好,暂不支持同时创建多个菜单。
2024-06-07 22:38:26
3068
1
原创 使用智谱 GLM-4-9B 和 SiliconCloud 云服务快速构建一个编码类智能体应用
本篇文章我将介绍使用智谱 AI 最新开源的 GLM-4-9B 模型和 GenAI 云服务 SiliconCloud 快速构建一个 RAG 应用,首先我会详细介绍下 GLM-4-9B 模型的能力情况和开源限制,以及 SiliconCloud 的使用介绍,最后构建一个编码类智能体应用作为测试。more我的新书已经开售!
2024-06-07 22:35:50
1811
1
原创 这才是大模型价格战背后的真相
首先需要肯定的是,降价是好事,极大的压缩应用层探索成本,利好普通 AI 应用开发者,不过新闻稿的水分太大了,毕竟老板一看到新闻说免费,那肯定指着成本最低的用,要求赶紧去调研,做模型切换,折腾的还是打工人 🥲;想必大家今天肯定被各家大模型厂商的降价新闻刷圈了,如果说 Meta Llama 3 的开源是国外大模型市场的搅局者,那 DeepSeek-V2 就是国内大模型市场的鲶鱼,但是价格战背后是大模型基础设施优化带来的物美价廉,还是浑水摸鱼的噱头?看官网介绍,这俩儿主要适用于微调,微调后的模型调用是收费的。
2024-06-05 21:14:59
1047
原创 数据污染对大型语言模型的潜在影响
总之,数据污染在LLMs中构成一个潜在的重要问题,可能影响它们在各种任务中的性能。它可能导致结果偏倚并削弱LLMs的真实有效性。通过识别和减轻数据污染,我们可以确保LLMs运行良好并产生准确的结果。现在是技术社区优先考虑数据完整性在LLMs的开发和利用中的时候了。通过这样做,我们可以确保LLMs产生无偏见且可靠的结果,这对于新技术和人工智能的发展至关重要。
2024-04-26 14:37:36
1757
1
原创 快速体验 Llama3 的 4 种方式,本地部署,800 tokens/s 的推理速度真的太快了!
北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama1、Llama2和CodeLlama之后的第三代模型,Llama3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型,你有没有第一时间体验上呢,这篇文章就分享下如何在Groq上以超过 800 tokens/s 的魔鬼推理速度体验Llama3,会同时分享Web端、移动端、API方式以及集成到LangChain中4种体验方案。我的新书已经开售!
2024-04-26 14:26:51
2980
原创 AI 领域精选高质量信息源分享
我在这篇 ChatGPT 发布一周年的总结文章中,已经推荐了不少优质的信息源,但主要还是偏技术向,随着我自己的身份从纯研发角色转变为产品,我的信息源也对应做了一次更新,增加了非技术部分,经过两个月的迭代,基本还算满意,所以这篇文章来总结下。
2024-04-16 22:31:57
1548
原创 如何评估一个RAG(检索增强生成)系统
总体上 RAGAs 框架中的指标拆的比较细,考虑的比较全面,大家可以重点阅读下项目整体文档,然后借鉴下部分指标整合进自己的设计,而生成式搜索引擎中的方案,从实践出发,提炼的指标虽然少,但是能够很好的评估出 RAG 应用的效果,直接采用,系统也不需要过多工作量。
2024-04-16 22:25:09
3161
原创 基于大模型的Agent进行测试评估的3种方案
我们都知道当前基于大模型构建的 Agent 能力极不稳定,而今年我司产品又在规划接入 Agent 能力,所以在引入之前,需要先设计一套测试框架,来看看各种场景下容错率是否能达到目标阈值,所以我调研了几种测试方案,本篇来总结下。
2024-03-13 15:25:23
3388
原创 基于大模型的 Agent 进行任务规划的10种方式
基于大模型的 Agent 基本组成应该包含规划(planning),工具(Tools),执行(Action),和记忆(Memory)四个方面,上一篇中多轮对话中让AI保持长期记忆的8种优化方式(附案例和代码)重点讲了进行长记忆管理的 8 种方案,本节将从 Agent 概念、ReAct 框架、示例、以及一些论文思路来具体聊下任务规划的话题,同时会辅以代码帮助理解,欢迎大家一起探讨。
2024-03-13 15:16:30
3857
原创 LLMs 应用开发框架 Semantic Kernel 和 LangChain 比较
本文首发于博客Semantic Kernel 和 LangChain 是当前比较受欢迎的两款 LLMs 应用开发框架,笔者通过实现一个支持联网功能的智能 AI 助手来比较分析下两个框架的差异(适合自己场景的工具才是最好滴 🧑🏻💻)
2023-11-07 14:21:09
1622
原创 一种基于滑动窗口的RAG优化实现方案探索
RAG(检索增强生成)是一种结合了检索(通常是知识库或数据库)和生成模型(大语言模型)的技术,目的是在生成文本的时候能够参考相关的外部知识。这样,即使生成模型在训练时没有看到某些信息,它也能在生成时通过检索到的知识来生成更加准确和丰富的回答,这篇文章实现一种基于动态上下文窗口的方案,能够处理大规模文档,保留重要的上下文信息,提升检索效率,同时保持灵活性和可配置性。
2023-11-07 14:20:43
2153
原创 如何利用 instructor 提高 RAG 的准确性和召回率
RAG(Retrieval Augmented Generation)是一种检索增强生成技术,它利用大型语言模型来处理用户查询,RAG 技术的主要组成包括数据提取—embedding—创建索引—检索—排序(Rerank)—LLM 归纳生成,不过实际落地过程来看,将用户查询转换为嵌入向量直接检索,很多时候的结果在相关度方面没有那么理想,本篇分享一种对用户查询进行重写再去进行检索从而提高准确性和召回率的方案
2023-10-15 21:37:35
1749
Ubuntu16.04+Python3+虚拟环境以及VScode配置
2018-12-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅