自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

人工智能AI技术

专注于人工智能AI技术的研发和教育

  • 博客(1195)
  • 收藏
  • 关注

原创 人工智能教程 - 前言

很多人都想学人工智能,它比黑客技术更加神秘更加吸引人。但是很多人都不敢学,因为传统教材的门槛都很高——需要编程,高数,统计学等等知识。所以我才编写了这一系列教程,使它通俗易懂,接地气,无需高数,只要你上过高中,就可以学!而且,传统教材都很枯燥,即使作者花时间写得很易懂但依然很少人能坚持学下去,因为太枯燥了。所以我主张快乐学习,尽量加入搞笑的成分在教程里面,其实我生活中就很乐观幽默,歌手李健就是我性格的一个写照吧,只不过我能说荤段子他不能。金杯银杯不如口碑,读者的留言让我的努力得到了认可!

2020-07-28 10:33:50 1044629 77

原创 LLM是怎么预测下一个词?从Token到Transformer完整原理拆解

很多人第一次听说大语言模型,都觉得它像个"语言天才"。你问它问题,它能答;你让它写代码,它能补;你让它写情书,它比你还会。但真相是——它根本不是在"理解"语言,它只是在玩一个超级高级的"接龙游戏"。就像你妈听你说话,你刚开口"妈,我……",她就能预判:“你又要钱是吧?LLM 干的就这事。只不过它预判的不是"要钱",而是下一个 Token。Token 是啥?可以是一个字、一个词、半个词,甚至一个标点。你输入"中国的首都是",它脑子里算的是:“北京 92%,北平 4%,长安 2%,上海……上海你认真的吗。

2026-07-04 18:43:03 199

原创 抛弃PaddleOCR!RapidOCR速度碾压,本地离线秒识别

我在 Mac M1 上跑 PaddleOCR,识别一张图要 5 秒。5 秒啊!我泡的泡面都好了,它还在那转圈圈。这速度,让我想起了大学时代的网速。那时候下个电影,睡一觉醒来刚好 99%,然后断线了。于是我决定:分手吧,PaddleOCR。你很好,但我们不合适。22 年经验告诉我一个道理:工具不是越重越好,合适才是王道。PaddleOCR 很强,但它像一辆装甲车。你要只是去楼下买个菜,开装甲车干嘛?RapidOCR 就是一辆小电驴。轻快、灵活、哪都能去,还不用考驾照。

2026-07-04 17:40:17 66

原创 彻底搞懂 Git Worktree!AI 编程必备的代码隔离神器

官方说法:worktree 允许一个仓库关联多个工作目录。人话翻译:同一个 Git 仓库,开出多个"平行宇宙",每个宇宙里干不同的活。你可以把同一个仓库的不同分支,分别放到不同的文件夹里。它们看起来是三个独立的项目,但底层共用同一个 Git 数据库——就像三胞胎共用一个大脑,但各自有独立的人格。简单项目:直接在主目录改,别给自己加戏。就像去便利店,走路去就行,别叫直升机。复杂项目/AI 并行:一定要用 worktree 做隔离。一个任务一个目录,各干各的,互不打架。

2026-07-03 19:23:10 310

原创 中小企业RAG工程实战:文档入库、混合检索、降级机制完整架构

这篇文章想传达的核心观点其实就一个:企业级 RAG 的工程复杂度不在 LLM,在检索。大模型 API 是 RAG 链路的最后一公里,但你得先让前九十九公里跑通了,这一公里才有意义。前九十九公里包括:文档怎么进来、怎么被切、怎么被检索、检索结果怎么被精排和补全、整个链路怎么被观测和优化。就像你点外卖,最后一公里是外卖员送到你手上,但前面九十九公里是商家接单、后厨做饭、打包、物流调度。如果前面九十九公里崩了,外卖员就算会飞,也送不来一份不存在的饭。

2026-07-03 17:49:56 196

原创 AI工程师生存指南:一文理清大模型全链路名词关系

现在最火。Ollama把"下载模型、配置环境、启动推理服务"这一整套原本对新手很繁琐的流程,简化成一条命令ollama run llama3就能跑起来。背后自动处理模型下载、量化、加载、本地HTTP API暴露。这种"开箱即用"的体验,是它在个人开发者和本地部署爱好者中迅速走红的核心原因。Ollama的推理内核基于llama.cpp,因此天然原生支持GGUF格式。模型仓库(Ollama Library)里的模型也都是预先转换打包好的GGUF文件。用户不需要关心格式转换细节。

2026-07-02 21:57:01 721

原创 别再盲目安装Claude技能!从囤积到精简的实战取舍心得

我花了三个月,把 Claude 的 Skill 生态从「拼多多砍一刀」模式,进化到了「断舍离」模式。第一个月,我看到 awesome-skills.com 首页挂的,恨不得全装。.claude/skills/ 目录里塞了 50 多个文件夹,感觉自己像囤了 50 双球鞋的蜈蚣——每只脚都穿不过来,但看着爽。第二个月,我发现 Claude 每天真正用的 Skill 不超过 5 个。剩下 45 个在文件夹里吃灰,像健身房年卡——办了就是练了,练了就是瘦了。第三个月,我清库存了。

2026-07-02 20:04:30 228

原创 RAG并未过气:从AI顶流到Agent生态黄金配角

最近逛技术社区,我发现一个特别扎心的现象。两年前,你去任何一个AI沙龙,开口不提RAG,人家都觉得你是来蹭茶歇的。现在呢?你张嘴说RAG,旁边小哥默默端起咖啡杯,眼神里写满了"这大叔还在用诺基亚呢"。RAG,这位曾经的AI顶流,如今混得比过气网红还惨。但我要说句公道话:它不是凉了,它只是从"C位出道"变成了"幕后打工人"。今天咱们就聊聊,这位"过气顶流"到底经历了什么,以及它为什么其实活得比以前更好了。RAG热度回落,不是它的失败,而是AI行业成熟的标志。

2026-07-01 18:02:17 218

原创 LangChain+LangGraph从零搭建AI智能体,踩坑完整教程

2024年你要是没写过AI Agent,出门都不好意思跟同行打招呼。就像2018年没买过比特币,2020年没炒过NFT,2022年没玩过AIGC——咱们程序员圈子的焦虑,永远比技术更新快三个版本。所以今天咱们就来手搓一个Agent。不是那种"调个API就敢说自己是AI工程师"的Hello World,而是一个真正能动手、能思考、能记仇——不对,能记上下文——的完整Agent。全程TypeScript,全程LangChain,全程踩坑。工具是Agent的手。

2026-07-01 17:57:38 239

原创 深耕22年AI:拆解生产级Agent完整工程架构,告别缝合怪智能体

用户说"帮我分析librepods是否能让Android完整支持AirPods",Planner输出6步计划,Executor只执行当前步骤"读取README并提取功能列表",Verifier检查"有没有把项目宣传当成事实?用户搜"PMGD配置",第一块讲的是"Android 17引入了PMGD",第二块讲的是"/vendor/etc/pmgd/config.json配置memory.high"。大模型说"我要查天气",工具返回了"今天适合钓鱼",大模型说"那我要订机票",工具说"您还没告诉我去哪"。

2026-06-30 22:19:13 225

原创 ponytail爆火:专治AI编程过度造轮子,代码直接砍半

你有没有遇到过这种人?你跟他说"帮我倒杯水",他给你整了个全自动智能饮水系统,带水质监测、温度调节、APP远程控制,还附赠一份三千字的用户手册。水呢?还在研发中。现在的AI编程agent,差不多就这德行。你让它加个日期选择器,它能给你整出三个文件、一个npm依赖、一段时区讨论,外加半本设计模式说明书。最后你发现,浏览器原生就支持这个:一行搞定。404行代码,就为了干一件浏览器自带的事。这哪是写代码,这是行为艺术。

2026-06-30 22:14:39 209

原创 DeepSeek DSpark全面拆解:提速85%不是新模型,只是投机解码加速外挂

6月27号,DeepSeek跟北大联手扔出个东西,叫DSpark。一夜之间全网都在传"提速85%"。但翻了半天评论区,发现一个特别尴尬的事:八成的人在转,但没几个说得清这玩意儿到底干了啥。有人说是新模型,有人说是新芯片,还有人说是GPT杀手。我寻思你们这理解能力,跟我家WiFi信号一样,时有时无。今天我就把这事儿一次性唠明白。先泼盆冷水:DSpark不是新模型,不是新芯片,也不是GPT杀手。它是给DeepSeek-V4装的一个"加速外挂"——发动机没换,但跑起来快了一大截,而且一个字都不会写错。

2026-06-29 12:15:21 702

原创 DeepSeek狂招36人!80%岗位都在抢Agent工程师

兄弟们,DeepSeek 这次真的不装了。以前招聘跟做贼似的,偷偷摸摸挂几个岗位。现在呢?直接甩出 36 个岗位,所有部门规模至少翻一倍。老板直聘上更夸张,挂了 121 个职位。我数了数,从服务端到前端,从测试到运维,从产品到深度学习研究员,几乎是完整编制。就差招个食堂阿姨会调 Prompt 了。更离谱的是,我扒完这些 JD 发现一个恐怖事实:80% 的岗位里,都写着「Agent」三个字。啥概念?以前面试问「会 Redis 吗」,现在问「会 Agent 吗」。不会?

2026-06-29 12:11:28 387

原创 llama.cpp b9754提交根治Agent工具调用偶发解析报错底层原理详解

干了22年程序员,我发现一个规律:越是看起来"微不足道"的commit,越能让你半夜三点从床上弹起来。llama.cpp 最近有个叫 b9754 的提交,名字起得跟快递单号似的。但你别小看它,这玩意儿专治一种让人抓狂的病——Agent 工具调用时好时坏,跟抽风一样。你说气人不气人?你跟模型说"帮我查一下北京天气",它十次有八次乖乖听话,剩下两次突然给你表演一个"我生成的 XML 我自己都不认识"。这就好比你养了一只猫,平时你叫它"过来",它理都不理你。

2026-06-28 22:20:39 260

原创 告别高额Claude账单!CCR网关实现第三方模型无缝接入Claude Code

它的工作原理特别简单:Claude Code 只会说 Anthropic 方言,Ollama 和 DeepSeek 只会说 OpenAI 普通话,CCR 站在中间,左边耳朵听 Anthropic 的话,右边嘴巴说 OpenAI 的话,两边都觉得自己在跟原配聊天。你改一个变量,它推理五秒。,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。就在我准备卖掉键盘还债的时候,我发现了 Claude Code Router,简称 CCR。

2026-06-28 22:17:16 454

原创 【VibeCoding系列教程20】开发流程

看完这套流程,你可能会觉得:好麻烦啊,写这么多文档。但你要知道,前期花1小时写文档,后期能省下10小时的返工时间。我做了30多个Vibe Coding项目,那些一开始做好规划的,开发过程都很顺利,最后也都成功上线了。那些"想到哪做到哪"的,大多数都半途而废了。Planning is Everything,这是Vibe Coding的第一心法。好的规划不会限制你的创造力,反而会让你更自由。因为你知道自己在做什么,知道每一步该往哪走。就像开车有导航,你可以放心踩油门,不用担心开到沟里。

2026-06-27 22:43:34 315

原创 微软停用Claude Code背后:AI按Token计费正在拖垮大厂预算

讲个笑话:微软,市值3.5万亿美元,给OpenAI砸了130亿,给Anthropic投了50亿,结果——用不起AI了。不是那种"这个月预算紧张"的用不起,是"全员断供,立刻马上"的用不起。6月30日起,Windows、Office、Teams、Outlook、Surface,近十万工程师,Claude Code的授权全部取消。理由就四个字:账单太贵。所以各位开发者,下次你用AI生成代码的时候,记得心里默念:这一行代码,值几分钱。微软用不起的,你可能也用不起。本质是一样的:AI时代,省代码不等于省钱。

2026-06-27 21:56:42 208

原创 别再把大模型比作马:Agent与Harness的底层工程真相

最近圈子里流行一个说法,说大模型是马,Harness是马鞍。马?你管这玩意儿叫马?你见过哪匹马能一夜读完人类五千年文明还跟你讨论存在主义的?你见过哪匹马写代码比你还溜,bug比你还少,加班还不用给加班费?这比喻最大的问题不是侮辱了马,是侮辱了咱们这些搞AI的。你天天骑着一匹马去打仗,和天天抱着一个刚觉醒的大脑去打仗,能是一回事吗?马跑了你能追,大脑要是突然开始思考"我是谁",你追个试试。这就好比你跟你妈说"我养了一只猫",结果牵出来一头老虎。猫和老虎都是猫科,但一个能撸,一个能把你撸了。

2026-06-27 21:49:12 171

原创 【VibeCoding系列教程19】 Agent Skills

Agent Skills这个东西,说白了就是让AI从"通才"变成"专才"。以前我们用AI,就像请了个全科大学生,啥都懂一点,但做专业的事总差点意思。现在有了技能包,你可以给AI装上前端设计技能,它就是UI总监;装上数据库技能,它就是DBA;装上安全审计技能,它就是白帽子黑客。而且安装简单,跨平台通用,社区生态丰富,还能自己定制。最重要的是,它解决了AI编程最大的痛点——千篇一律。以后你让AI做网页,不会再看到蓝紫渐变了。除非……你自己喜欢蓝紫渐变。那当我没说。

2026-06-25 22:08:34 259 1

原创 22年AI老兵拆解:Loop Engineering到底是不是新瓶装旧酒

当下正是大模型领域概念井喷的阶段,每次一个新词走红,总会伴随铺天盖地的"万字解读"和"概念包装"。Loop Engineering有价值吗?有。它确实为"让AI自动循环工作"这件事给出了一个明确的命名,让从业者能更精准地交流。但它神秘吗?不神秘。复杂吗?不复杂。本质上就是在已有技术体系上多加了一层调度逻辑而已。就像你家的扫地机器人,以前要手动按开关,现在定时自动扫,扫完自己回去充电。这就是Loop Engineering的生活版。

2026-06-25 17:57:59 421

原创 【VibeCoding系列教程18】IDE插件

装完这些插件,我的VS Code已经从"记事本Pro"进化成了"星际战舰"。Claude Code是舰长,GitLens是雷达,ESLint和Prettier是左右护法,Error Lens和Console Ninja是预警系统。而我?我大概是那个坐在驾驶舱里喝咖啡的指挥官,偶尔按个按钮,看着AI们干活。当然,插件再多,也只是工具。真正让代码跑起来的,还是你脑子里的逻辑。不过话说回来,有好工具不用,那不是清高,那是跟自己过不去,就像有电梯不坐非要爬楼梯,锻炼的是腿,累的是心。你去试试,不好用回来骂我。

2026-06-24 21:52:52 197

原创 Claude Code处理大型单体项目痛点解决:工具精简、分层检索、LSP语义索引

上个月,我们干了一件特别"勇"的事——把一套180K行的Spring Boot单体代码库,整个儿塞给了Claude Code,让它做一次全量架构分析。180K行啊,什么概念?相当于把《红楼梦》前八十回翻译成Java,还加了不少注释,连贾宝玉的getter和setter都写得规规矩矩。Claude倒也没客气,哐哐哐输出了一份依赖关系图,比我们技术Lead画得还细,连三处我们自己都没发现的循环依赖都揪出来了。

2026-06-24 18:44:28 205

原创 Java面试大变天!大厂七成考题全是AI Agent核心考点

前两天刷脉脉,看到一条消息给我整乐了。某大厂面试官说,现在面Java岗,AI相关的题已经占到七成了。我寻思着,这哪是面试啊,这是Java程序员的大型转岗现场啊。以前面试问什么?HashMap底层、Redis缓存穿透、Spring循环依赖。现在呢?“说说你的Agent怎么设计的”“ReAct循环怎么实现的”“记忆压缩用的什么算法”。不过话说回来,这趋势挺真实的。我干了22年AI,从当年用决策树做推荐,到现在跟大模型斗智斗勇,最大的感受就是:技术迭代的速度,比我老婆变脸的速度还快。

2026-06-24 18:02:37 230

原创 【VibeCoding系列教程17】 MCP

说实话,程序员这行干久了,你会发现一个残酷的真相:我们花在实际写代码上的时间,可能连三分之一都不到。剩下三分之二在干嘛?在跟文档较劲,跟搜索引擎谈恋爱,跟部署流程搏斗,跟爬虫反爬机制玩猫鼠游戏。直到有一天,我发现了MCP这玩意儿,才恍然大悟——原来AI不是不会干活,是以前没人给它发工具啊!

2026-06-23 21:40:18 258

原创 一文讲透Prompt、Context、Harness 工程

未来做AI产品的人,能力结构会越来越像半个产品经理、半个工程师、半个流程设计师。要会写Prompt,但不能迷信Prompt。要懂上下文,但不能只会堆资料。要做Harness,但不能为了工程而工程。说到底,就是把模型当成一个强但不稳定的认知引擎,然后在它外面搭一套让它稳定工作的系统。真正的AI工程能力,不是写好一句Prompt。而是把Prompt、Context、Harness三层一起设计好。Prompt决定任务。Context决定知识。Harness决定可靠性。

2026-06-23 18:38:23 231

原创 【VibeCoding系列教程16】 我的AI工具箱

2026年过去一半,我算了笔账,发现今年最大的开销不是房贷,也不是车贷,是AI工具的会员费。上个月我老婆查信用卡账单,指着一条记录问我:“你这个月给一个叫Cursor的东西充了一万多?你是不是还在外面养了个叫Claude的小三?我赶紧解释:“不是小三,是代码。她更懵了:“代码值一万?你写的代码不是一直不值钱吗?我当场破防。因为她说得对,但这就是程序员的命。别人花钱养车,我们花钱养AI。今天我就摊牌了。这一年来我试了差不多一百个AI工具,烧了不少钱,踩了不少坑,最后只留下了这20个。

2026-06-22 22:37:33 254

原创 Agent不是ChatGPT!看懂AI智能体完整开发体系

最近有个朋友问我:“你们搞AI的天天说Agent,这玩意儿跟ChatGPT到底啥区别?我说:“这么跟你说吧,ChatGPT是你花500块请的顾问,你问啥它答啥;Agent是你花5000块请的助理,你让它干啥它真去干。朋友又问:“那我自己用LangChain调个API,是不是就算开发Agent了?我笑了。这问题就像问:“我买了把菜刀,是不是就算米其林大厨了?他还不死心:“那网上的Demo看起来挺简单的啊?我说:“Demo简单是因为人家把坑都踩完了,只给你看成品。

2026-06-22 22:03:51 965

原创 Multi-Agent多智能体实战:三种主流协作模式避坑详解

说实话,我写了22年代码,见过太多"全栈工程师"——就是那种前端后端运维测试客服销售全一个人干的。最后啥结果呢?头发没了,脾气大了,代码里全是TODO。AI Agent也一样,你非要一个Agent既当爹又当妈,它迟早给你表演一个"人工智障"。今天咱们聊聊——怎么让多个AI分工协作,而不是让一个AI累到冒烟。放心,不整那些八股文,咱们用说人话的方式,把这事儿唠明白。能简单就别复杂。Multi-Agent不是越复杂越好。能用一个Agent加几个工具解决的,别上Multi-Agent。

2026-06-22 21:58:44 886

原创 Web Agent避坑指南:给LLM上网必须加上三层Guard

兄弟们,今天聊一个扎心的话题:你家AI是个"断网青年"。你问它"LangGraph最新版本是多少",它一脸懵逼:"根据我2023年的知识……"停!都2026年了,你跟我聊2023年?那我跟你说我2023年还有头发呢,你信吗?所以Web Agent诞生了——给LLM装个浏览器,让它真正上网冲浪。听起来很美好对吧?但问题来了:你让一只猫去上网,它可能会把键盘踩烂,可能会点进奇奇怪怪的网站,还可能永远停不下来。别笑,LLM比猫好不到哪去。

2026-06-21 22:08:38 170

原创 Claude Code写代码bug成堆,AI时代程序员如何避免背锅

前两天我跟一个干了十年的老程序员喝咖啡,他端着杯子手都在抖。我说你咋了,咖啡因过量?他说不是,是Claude Code又给他生成了三千行代码,他看了一晚上,发现里面藏着十七个bug,个个都像俄罗斯套娃——打开一个,里面还有仨。我说那你咋不直接问AI修呢?他苦笑:我问了,AI说"好的,已修复",结果又多了二十一个bug。现在他的项目就像用 spaghetti 织的毛衣,越扯越乱。这大概就是2026年程序员的日常:AI能写代码了,但AI写的代码,得靠人来背锅。

2026-06-21 21:58:03 202

原创 【VibeCoding系列教程15】 AI辅助工具集

好了,今天的工具清单就这些。别被这么多工具吓到,你不需要一天全学会,那不是人干的事。我的建议是:先装Git,建个GitHub仓库,然后把项目丢到Vercel上跑起来。看着自己的作品真正在互联网上运行,那种成就感,比AI帮你写一百行代码都爽。工具是死的,人是活的。遇到问题了再学,效果最好。现在,去试试吧!

2026-06-21 21:51:43 300

原创 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

想象一下,100个AI同时给你出主意,其中50个说"用Python",49个说"用Java",还有1个说"要不咱们用Excel吧"。高层Agent说"我们要做一款改变世界的产品",中层Agent翻译成"下周上线一个按钮",底层Agent连夜写代码,最后发现按钮是灰色的,因为高层没说要让它能点。这种架构的好处是职责清晰,坏处是如果测试Agent发现编码Agent写的全是bug,它不能跳过编码Agent直接改代码——它只能发消息,然后等,就像你给同事提了个bug,他已读不回,你只能盯着屏幕发呆。

2026-06-20 21:59:03 178

原创 Qoder Browser Use实测:AI终于能像真人一样操控浏览器

AI已经开始抢浏览器操作工的饭碗了。没错,我说的就是Qoder这货。它最近搞了个Browser Use功能,直接把Agent的联网能力拉到了满中满,满到溢出来。作为一个在AI领域摸爬滚打了22年的老炮,我见过太多"号称能上网"的AI工具。结果呢?要么卡在登录页面像只无头苍蝇,要么把网页元素当成抽象画来欣赏。Qoder这次不一样,它玩真的。22年前,我刚入行的时候,写个爬虫要手写正则,处理反爬要研究HTTP头,模拟登录要抓包分析Cookie。

2026-06-20 21:54:57 220

原创 吃透AI Agent五层架构,16个核心概念一次性讲透

最近半年,“AI Agent"这个词泛滥程度,堪比十年前的"互联网思维”。GitHub上相关项目动不动就几十万Star,朋友圈天天"这个炸了"“那个爆火”。但你真逮住一个人问:“Agent到底是个啥?”——他支支吾吾的样子,像极了被班主任点名却根本没预习的我。我干了22年AI,从神经网络还没火的时候就开始跟这玩意儿打交道。今天不整那些虚的,咱们从最底层的Token开始,一层一层往上扒,把这16个概念全给你唠明白。放心,全程有段子,绝不催眠。

2026-06-19 22:09:01 829

原创 黄仁勋即中本聪:AI Token,BTC 2.0算力新秩序

前两天刷虎嗅,看到一篇文章标题:《黄仁勋即中本聪》。这老黄是偷偷挖了几年矿,还是中本聪去韩国整容了?22年AI经验告诉我,凡是标题带"即"字的,不是天才就是骗子。比如"我即吴彦祖",显然属于后者。但看完文章我发现,这标题虽然夸张,逻辑居然有点意思。我斗胆下个定义:AI的算力,即Token,它其实是**BTC 2.0**。

2026-06-19 22:07:00 271

原创 拆解Transformer架构:为什么你的AI账单越用越贵?

Transformer这架构,说白了就是用注意力机制解决了RNN和CNN的硬伤。全局视野+并行计算,让它成了大模型的唯一选择,跟智能手机取代功能机一样不可逆。但理解它不是为了背公式,是为了知道为什么你的Prompt要结构化,为什么上下文不能太长,为什么重要信息要放开头或结尾,为什么Token越用越贵。你不懂这些,就像不懂油价机制还天天开车,每个月被加油站"温柔地"抢劫。下次看到账单上几万Token的时候,你可以淡定地喝口茶:“哦,这是O(n²)的代价,我懂。然后默默把上下文清理了一下,重新发了一次。

2026-06-18 22:53:12 1004

原创 Prompt已死,Loop为王:新一代AI工程Loop Engineering完整详解

2026年6月的同一周,两个AI大佬几乎说了同一句话。Boris Cherny在推特上写:「别再提示了,开始循环,Prompt已死,Loop才是新的工作单元。Peter Steinberger在博客里说:「我们花了数年完善prompt,现在发现真正的工程在于设计让prompt变得不必要的loop。两个不同背景、不同产品的人,得出了相同结论。这不是巧合,这是范式转移的信号。当然,也可能是他们同时被自家AI的prompt搞崩溃了,半夜三点同时拍桌子:「老子再也不写prompt了!

2026-06-18 22:50:08 391

原创 当AI开始自主干活:Prompt工程师该转型还是退场?

写到这里,我突然想起一件事。22年前,我入行的时候,老前辈跟我说:“AI这行,唯一不变的就是变化。当时我觉得这是句废话。现在我发现,这是句真理。而且这句真理的更新频率,比我的手机系统还快。我刚学会iOS 16,别人都用到iOS 26了。Fable 5的出现,不是让某个岗位消失,而是让整个协作模式重构。人类从执行者变成决策者,从手艺人变成甲方。这个转变,有人欢喜,有人不安。欢喜的是,终于不用熬夜调参数了。不安的是,你突然发现自己没什么可做的了。

2026-06-17 12:23:19 200

原创 AI秒出答案的时代,别让快速回复废掉你的深度思考

AI给答案只要三秒。我泡杯咖啡还得等三十秒呢,它已经把代码写完了、文章写好了、PPT做出来了。我坐在屏幕前,感觉自己不是程序员,是AI的行政助理——专门负责点发送键。干了二十二年AI,我见过太多大风大浪。但最近这股风,差点把我脑子吹没了。AI会越来越强。答案越来越快、越来越准、越来越像"你自己想出来的"。这就是最危险的地方——当AI的答案越来越像你的思考时,你怎么分辨哪些是你真正想明白的,哪些是AI喂给你的?就像你吃了太多外卖,已经忘了家常菜什么味道,甚至觉得外卖就是家的味道。

2026-06-16 23:10:38 180

原创 Redis作者发声:中国大模型崛起,不该被简单扣上“蒸馏抄袭”的帽子

这锅,"蒸馏"不背。,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。但 DeepSeek 的论文是公开的,代码是开源的,训练细节是透明的。软蒸馏需要白盒访问,老师不仅给答案,还给完整的思考过程和信心指数:“这道题我选 A 的概率是 85%,选 B 是 10%,选 C 是 5%,因为……

2026-06-16 23:07:56 237

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除