自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

在渔村里看AI,偶尔捕点新鲜的。

渔村里没有权威,只有一起学习的鱼友。AI技术、踩坑经验、真实数据,有问题随便问,有干货一起学。

  • 博客(299)
  • 收藏
  • 关注

原创 技术采纳曲线的博弈哲学:AI时代你在哪,比用什么重要

场景你的位置建议决策信号AI编程开发者但没用AI立即进入Peer采用率 >50%AI编程已用AI加深投入个人效率提升 >30%AI客服所在行业渗透率 >30%立即部署竞争对手已上线AI客服所在行业渗透率 <10%准备基础设施标杆案例出现AI写作任何内容创作者适度辅助读者不排斥AI辅助内容AI投资长线投资者基础设施 + 已验证PMF应用注意力指标持续上升开头我说:这系列文章的核心是一个问题的不同侧面——AI的真实渗透率和潜在的空间。

2026-06-21 10:37:07 295

原创 AI冰山模型:80亿美元花错了方向,65亿人还没下水

站在2026年回看AI的普及进程,最有趣的事情不是AI有多厉害,而是大多数人根本不知道AI发生了什么。82亿人里有65亿从没用过AI。10亿月活用户的ChatGPT,深度使用者不过几百万。中国AI渗透率53%——但如果你去二线以下城市问问"用AI做什么",绝大多数人的答案是"聊天呗"。AI的冰山,露在水面的尖顶已经被媒体炒成了珠穆朗玛峰。水面之下的基座,深得看不到底。GPU、HBM、先进封装、AI数据中心的产业链长期逻辑没有动摇。

2026-06-21 00:16:14 207

原创 Agent四层记忆架构:为什么你的Agent总是失忆?

Agent的记忆系统不是"上下文窗口够不够大"的问题,而是"你有没有给Agent装上长期记忆"的问题。

2026-06-18 08:43:35 131

原创 LLM Agent的约束衰减:为什么30%的代码生成不可用?

2026年5月,arXiv论文《Constraint Decay: The Fragility of LLM Agents in Backend Code Generation》(arXiv:2605.06445)给出了精确的定义和量化证据:当结构约束逐渐累积时,Agent的性能出现显著下降。能力较强的配置在完整约束任务上比基线任务平均损失30分(assertion pass rate),而较弱的配置接近零分。约束越多,Agent越笨。不是慢慢笨,是断崖式笨。这个发现来自一组严格的对照实验。

2026-06-18 08:41:53 147

原创 SkillOpt:把Agent的技能当可训练权重,而不是一次性Prompt

SkillOpt把"写好Prompt"从一门手艺变成了一门工程——有数据、有验证、有迭代、有保证。

2026-06-18 08:40:49 216

原创 AI你不知道的事:算力芯片电力资源的隐形成本

AI 看起来是软件,但底层全是物理。每一行 AI 生成的代码背后,是芯片在发热、内存在搬运、冷却液在流动、电表在转、水在蒸发、旧硬件在堆成山。理解这些隐形成本,不是为了唱衰 AI,而是为了更清醒地判断:什么值得做,什么只是看起来酷。算力不会无限增长,电力不会无限供给,水也不会凭空出现,芯片也不会凭空消失。在物理定律的约束下,效率才是终局。那些能同时优化算法效率、硬件利用率和能源效率的公司,才是 AI 时代的真正赢家。

2026-06-18 05:17:28 202

原创 TBase vs Redis:不是选谁,是选谁干什么

TBase vs Redis 不是选择题,是分工题。需求用什么数据不能丢,查询要复杂TBase(或单机PG)读得要快,写得要快,丢了能恢复Redis两者都要TBase+Redis,Cache Aside模式只有一个,选谁选TBase(数据安全优先,缓存可以后补)最后一条建议很现实:如果你预算有限只能部署一套系统,先部署关系型数据库。缓存可以后加,数据丢了无法后补。Redis是锦上添花。TBase(或PostgreSQL)是雪中送炭。先解决"存得住",再解决"读得快"。

2026-06-17 12:27:14 170

原创 RAG分块策略与混合搜索:那些网上没人讲清楚的技术细节

知识库中提到:关键优化在于为每个分块附加丰富的元数据,如文档来源、章节标题、创建时间等,并将其存储于向量数据库中。"""为分块添加元数据"""metadata={"has_code": "```" in chunk, # 是否包含代码"has_table": "|" in chunk, # 是否包含表格过滤检索:可以按来源或时间范围过滤调试:知道问题文档来自哪里展示:告诉用户答案来自哪个章节RAG系统的分块策略,说到底是在信息完整性和检索精准度之间找平衡。

2026-06-17 12:21:18 179

原创 AI应用数据库选型:三件事想不清楚,你搭的架构就是定时炸弹

做AI应用开发,数据库选型比技术本身更致命。三套数据库,三套运维,三套故障点。今天不聊三种数据库各自有什么能力,搜索引擎比我说得好。

2026-06-17 09:17:05 278

原创 多维度限流实战:用户×资源×时间,三个维度一起限才有意义

单一维度限流是"能跑"。多维度限流是"能跑且跑得久"。用户维度解决"谁在用"的问题。资源维度解决"用什么"的问题。时间维度解决"什么时候用"的问题。三个维度各自有盲区,合在一起才能覆盖生产环境的复杂场景。限流不是只有"允许"和"拒绝"两个选项。降级、排队、延迟执行,都是限流策略的一部分。把这句话写进你的代码注释里。下次做限流设计的时候,想想除了return 429,你还能做什么。

2026-06-17 08:21:48 216

原创 AI时代的限流:当Token比QPS更致命,你的系统可能正在裸奔

传统限流解决的是"请求太多服务器扛不住"的问题。LLM限流解决的是"Token消耗不可预测、成本不可控、多供应商规则不统一"的问题。维度变了,打法也得变。按Token限流,不是按请求。TPM才是杀手,RPM只是表面。降级不是失败,是设计。多模型、多供应商、缓存兜底,每一层都是保险。可观测性不是可选项。不监控429错误率的LLM应用,和裸奔没区别。别等生产环境被429打爆了才想起来加限流。现在就去检查你的代码里是不是还在用。

2026-06-16 18:37:11 321

原创 你以为加了限流就安全了?限流的12个反模式,每一个都可能搞崩你的生产环境

限流失败的原因,总结起来是四类。反模式一(单点故障):没有考虑限流组件本身的可用性反模式八(限流降级割裂):把限流当终点而不是当入口反模式十一(规则硬编码):限流规则不能随流量动态调整反模式二(内存炸弹):滑动窗口实现没有控制数据规模反模式四(临界突刺):固定窗口边界效应没有处理反模式七(缺少Retry-After):429响应不完整反模式五(时钟漂移):跨节点时间不一致反模式六(粒度太粗):单一维度无法覆盖真实场景反模式十(热Key):限流Key分布不均导致新问题。

2026-06-16 18:27:45 505

原创 Token消费是未来必备消费:从算力账单到AI水电煤的产业跃迁

2026年,Token消费的拐点已经出现。Token不是技术消费,是基础设施消费。就像你不会质疑为什么要交网费一样,未来你也不会质疑为什么要买Token。问题是:你准备好了吗?本文数据来源:高盛2026年5月报告、Ramp内部数据、OpenAI官方数据、三大运营商官网、银河证券研报、Linux基金会公告。所有价格数据截至2026年6月。

2026-06-15 12:35:26 161

原创 Vibe Coding踩坑实录:3个项目从烂尾到交付的血泪经验

你也觉得Vibe Coding就是"跟AI说一句话,代码自己就写好了"?我拿3个真实项目做了完整的从启动到交付测试,结果发现:没有工程方法的Vibe Coding,烂尾率高达80%以上。本文记录了我踩过的所有坑,以及最终的解决方案。

2026-06-15 12:04:32 185

原创 Claude Fable 5发布3天即遭禁:中国开发者的断供求生指南

在AI时代,唯一不变的就是变化本身。工具会来来去去,但工程思维和架构能力才是真正的护城河。与其纠结哪个模型更好,不如花半天时间搭建一套模型适配层。这样无论明天谁被封、谁开放,你的项目都能平滑切换。你目前在项目中使用的是哪个AI模型的API?如果它明天突然不可用,你有多长时间能完成迁移?欢迎在评论区分享你的应急预案。标签:AI大模型、国产替代、API迁移、Anthropic、技术架构。

2026-06-15 12:03:53 192

原创 深度解析 LLM Agent 架构:从核心组件到生产级系统设计

2025 年,LLM Agent 领域论文发表数量呈爆发式增长,已超越传统终身学习研究。Agent 不再是"能聊天的机器人",而是能感知环境、调用工具、自主决策的"AI 个体"。但当 Agent 从 Demo 走向生产,开发者面临的不再是"能不能跑通"的问题,而是"能不能在客户手上可靠运行"。本文从知识库中萃取 AI 工程领域的核心知识点,结合 2026 年最新的 12-Factor Agents 方法论,系统拆解 LLM Agent 架构的方方面面。传统 LLM 应用是单轮请求-响应。

2026-06-14 20:57:12 947

原创 中国大模型周调用量碾压美国4.4倍:这组数据背后藏着怎样的产业真相

中国大模型调用量碾压美国4.4倍,这是一个事实。但这个事实的背后,是价格战、场景下沉、和推理算力红利的消耗。调用量领先≠技术领先。真正的技术领先,体现在模型质量、推理效率、和商业可持续性上。中国大模型厂商在调用量上已经领先,但在质量和利润率上还有很长的路要走。你觉得中国大模型的"价格战"能持续多久?调用量领先最终能转化为技术领先吗?评论区聊聊。标签:大模型, Token调用量, DeepSeek, 价格战, AI产业分析。

2026-06-14 11:08:40 184

原创 OpenAI严禁手写代码:人均PR吞吐量暴涨20倍的Harness Engineering,到底在做什么

从"人写代码"到"人定义规则,AI执行代码"。这个转变不会一夜发生,但方向已经很清晰了。未来的工程师,核心能力可能不是写代码,而是定义约束——知道什么是好代码,并且能把这个"知道"变成机器可执行的规则。你的团队有在尝试AI编程吗?你觉得Harness Engineering的理念在国内能落地吗?评论区聊聊。标签:OpenAI, Harness Engineering, AI编程, 代码质量, 工程效率。

2026-06-14 11:08:08 443

原创 华为鸿蒙HarmonyOS 7深度解析:从操作系统到AgentOS的架构跃迁

鸿蒙从0到6600万台设备用了14个月,而Agent架构的落地才刚刚开始。作为开发者,你面对的不是一个简单的"适配新OS"的任务,而是一个交互范式转移的历史节点。你觉得在AgentOS时代,传统App会被完全取代,还是会以某种形式与Agent共存?你最看好哪个场景率先跑通Agent模式?HarmonyOS7, AI Agent, 华为HDC2026, 鸿蒙开发, AgentOS。

2026-06-14 11:07:48 505

原创 豆包暴跌610万用户的真相:AI产品免费模式的死亡螺旋与破局路径

豆包的610万用户流失不是某个产品的失败,而是整个AI行业商业化探索中的一个重要数据点。在AI时代,产品思维需要重新校准。"任务模式"的上线是正确的方向。但真正的考验在于:这个Agent化转型能否足够快、足够好用,在用户流失惯性中形成新的增长曲线。你怎么看AI产品的付费模式?你愿意为哪种AI能力付费?是更强的对话能力、还是自动化执行能力、还是特定场景的解决方案?豆包AI, AI商业化, AI Agent, 产品策略, 字节跳动。

2026-06-13 15:52:17 199

原创 AI落地的最大瓶颈不是技术,是评估:一场路灯效应制造的集体迷失

Lun Wang的那篇博客标题没有用任何夸张的词汇。一个从Google DeepMind离职的研究员,选择用4000词平实地讨论评估问题。没有炒作,没有声明,只是把自己观察到的事实写出来。我们可能正在用错误的尺子,建造一个看起来正确但地基有裂缝的AI大厦。路灯效应不是AI独有的问题。医学研究中也有"可测量的偏差"(Measurability Bias),教育领域也有"标准化考试导致教学应试化"的争论。天文学家卡尔·萨根在讲述路灯效应时说:钥匙可能不在路灯下,但在那里找要容易得多。

2026-06-13 11:15:38 565

原创 MiniMax M3开源实战:4280亿参数MoE模型本地部署与性能评测

国产大模型正在构建"模型+算力+框架"的全栈自主化能力。对于开发者来说,现在是一个好时机——你可以用相对低的成本,在一个世界级的开源模型上做实验。你如何看待MoE架构vs Dense架构的未来?在你的实际业务场景中,更看重模型规模还是推理效率?欢迎在评论区分享你的实测数据。MiniMax M3, 大模型部署, MoE架构, vLLM, 国产大模型。

2026-06-13 11:15:18 520

原创 反脆弱税:普通人一生都在默默支付的隐形代价

信息差不是"内幕消息"(那是违法的)。你知道一些别人还不知道的有价值的信息,并且你能基于这个信息采取行动。地域信息差:你知道某个城市/区域的发展潜力,提前布局(买房/创业/就业)行业信息差:你知道某个新兴行业的机会,提前进入(比如2023年知道AI/LLM会爆发的人,提前转行/学习,现在已经有先发优势了)技能信息差:你掌握了一项别人还没意识到价值的技能(比如2022年就开始学Prompt Engineering/LLM微调的人,现在已经被市场高价抢了)资源信息差。

2026-06-13 02:53:16 404

原创 高考结束才是真正开始学习:给AI时代新人的一份真实学习路线图

回到开头那句话:“高考结束后才是真正该开始学习的时候。学习是一辈子的事,高考只是其中一个节点。AI这个领域,变化太快了。你今天学的框架,明天可能就过时了。你今天追的新模型,下个月可能就有更好的。所以,与其追每一个新技术,不如把基础打牢。数学基础、编程能力、学习能力——这三样东西,任何技术浪潮都淘汰不了。AI不难,难的是持续学习。高考结束只是起点,后面还有很长的路。祝他,也祝所有想学AI的人,走得快,更走得远。数据来源。

2026-06-13 01:12:50 418

原创 多智能体系统的真实瓶颈:为什么Demo流畅、生产必崩

你用 LangGraph 搭了一个多智能体系统。Demo 演示流畅无比:用户发一个问题,规划 Agent 拆解任务,研究 Agent 并行搜索,代码 Agent 执行分析,最终报告 Agent 汇总。用户看了直呼"厉害"。上线第一天:响应时间 8 秒,上下文窗口爆了,Token 费用是预期的 5 倍。第五天:某个复杂任务下 Agent 开始循环调用工具,重试 20 次后抛出异常,Token 消耗了一张机票钱。这不是你的问题。这是多智能体系统的结构性代价。

2026-06-12 22:49:15 401

原创 学历的社会成本:学信网下的身份焦虑

18岁那年,你在教室里坐了三天。笔下的答案决定了你未来四年的学校——这本来没什么问题,正常的人才选拔逻辑。但问题在于,这套逻辑被延伸到了你28岁、35岁、甚至40岁的求职中。十年后的HR还在用你18岁时的考试成绩来判断你——而且是单方面的,没有解释机会。有人高考前生了场病,有人填志愿时信息不对称,有人生在了一个211录取率不到4%的省份。这些因素在数据库里没有任何记录,只留下一个冷冰冰的「非985/211」标签。你打开学信网,看到的是一行「学历查询结果:1条」。

2026-06-12 12:54:38 150

原创 热搜消失指南:谁在决定你看到什么

你一定见过这种场景。一个话题明明引爆了全网,朋友圈刷屏,群里讨论得热火朝天,结果热搜上找不到。或者刚刚还在前三,过了一个小时莫名其妙消失。官方没有公告,平台没有解释,它就这么不见了。这不只是你的错觉。

2026-06-12 12:21:42 201

原创 手机远程控制Mac上的Claude Code开发:完整实战指南

组件作用为什么选它Tailscale内网穿透无需公网IP,点对点直连,延迟低SSH + tmux远程终端 + 会话保持断网不丢进度,多窗口并行AI编程助手原生终端体验,直接改代码随时随地:只要有网络就能连接Mac开发稳定可靠:tmux保护会话,网络波动不影响安全可控:Tailscale的ACL + SSH密钥双重保护原生体验:Termius提供真正的终端,不是远程桌面适用场景通勤路上处理紧急Bug外出时需要查看服务器日志多台设备协同工作没有公网IP的内网环境不适用场景。

2026-06-12 09:08:15 325

原创 RAG在理财多智能体中的真实用法:从书籍蒸馏到知识检索的完整实战

"""L2归一化,保证内积搜索等价于余弦相似度"""这个步骤很多人不做。不归一化的后果:长度影响相似度排序,短文本天然吃亏。花5分钟看完这篇文章。花3小时搭完这套流水线。你的理财Agent就会从一个"语义搜索工具"变成一个真正"懂你场景"的投资顾问。区别不在于你蒸馏了多少本书,而在于你怎么让知识在Agent手里发挥作用——该查PE的时候查PE,该做风险评估的时候做风险评估,该引用来源的时候知道从哪里引用。RAG真正发挥作用,不是因为它记住了所有信息,而是因为它知道怎么找到对的信息,怎么组合。

2026-06-12 08:24:56 208 3

原创 地理空间数据正在被军事化:宝可梦GO事件的技术复盘与警示

2026年6月,一则来自外媒的报道引发全球玩家愤怒:《精灵宝可梦GO》十年间积累的近300亿张玩家实景图像,正被用于训练军事级视觉定位系统。这批数据让一架没有GPS信号的无人机,在城市战场上仍能实现厘米级精准导航。这不是科幻小说。这是SLAM技术、大规模预训练视觉模型和地理空间数据共同构成的现实威胁。本文从纯技术视角出发,拆解这背后到底发生了什么,为什么一个AR游戏能积累出全球顶级的地理空间数据集,以及这些技术能力如何被转化为军事应用。写给所有对SLAM、计算机视觉和数据安全有关注的开发者。

2026-06-11 23:49:10 222

原创 iOS应用开发完整指南:从零到App Store上架(2026版,含费用清单)

很多开发者第一次接触 iOS 开发时,最头疼的不是写代码,而是搞不清楚"从哪里开始、每一步怎么做、哪里要花钱"。本文就是一份从零到上架的完整路线图,每一步都标注了是否涉及费用、具体多少钱,让你在动手前就能算清楚总成本。免费账号真机调试 7 天就过期,正式开发必须付费账号隐私政策写不好必被拒,提前准备好截图不要用模拟器截图,用真机截图或设计工具制作iOS 不支持 Flash、不支持网页直接套壳苹果审核不能用"测试账号"这个概念敷衍,要提供真实可用的测试账号密码。

2026-06-11 12:37:19 481

原创 本地部署项目手机远程访问:5种方案保姆级教程

你的需求选这个“我就想手机上打开看看”WiFi 局域网“我出门在外也想访问”Tailscale“我想给朋友演示我的项目”ngrok 或 Cloudflare Tunnel 临时模式“我要长期稳定地远程访问”Tailscale“我要给别人通过域名访问”Cloudflare Tunnel 永久模式“我有服务器,要穿透多个服务”frp我的最终建议:先把 Tailscale 装上。它免费、零配置、永远有用,装一次终身受益。以后不管什么场景,Tailscale 都能覆盖你的基本远程访问需求。

2026-06-11 08:39:37 362

原创 AI手机开发:不是装了AI助手的手机,是APP之间的墙被推倒了

你正在微信里和朋友聊周末的演唱会。AI在后台已经帮你做完了三件事。它打开大麦网查了场次和余票。它比对了你的日历确认那天有空。它生成了购票方案等你点头。你不需要切换App。不需要复制粘贴。不需要在五个应用之间跳来跳去。这就是AI Agent手机正在做的事。不是给你装一个更聪明的Siri,而是把AI放进了驾驶座。

2026-06-11 08:38:03 196

原创 理财数据源全景实战:从免费API到专业数据库,搭建你的投资数据管道

实时行情 + 基金数据 → akshare(免费)历史回测 → baostock(免费)海外资产 → yfinance(免费)财务数据 → tushare免费版(注册得token)性价比补充 → 理杏仁(约200元/年,可选)

2026-06-11 08:22:55 213

原创 从鹅腿阿姨塌房,看私域流量的致命缺陷——给技术人上的三堂课

没有淘宝店没有美团入驻没有大众点评页面没有第三方支付记录(微信转账为主)没有评价体系没有退款机制所有的交易,都发生在20多个微信群里。私域流量的本质:把公域的监管、评价、保障机制全部剥离,用个人信任替代制度信任。一个值得玩味的细节:举报鹅腿阿姨的,不是清北的学生,是国贸CBD的上班族。阿姨原本只在高校周边摆摊,2026年6月才把生意拓展到朝阳国贸CBD。结果刚去一天,就被举报了。同一个人,同样的鸭腿冒充鹅腿,在人大、北大、清华卖了8年没人举报,到了国贸一天就被举报了。这不是巧合。

2026-06-11 05:21:31 664

原创 2026年AI就业市场:不是没人要,是你的方向错了

一个做了五年Java的后端工程师,上个月在朋友圈发了一条动态:“投了40家AI公司,全部石沉大海。评论区有人安慰,有人说AI泡沫要碎了。但真相更残酷,也更简单:他投的全部是算法岗。同一个时间,他前同事转去做了AI Agent开发,两个月拿到3个offer,薪资翻了一倍。这不是幸存者偏差。

2026-06-10 08:36:58 312

原创 ECC 20万Star背后:AI Agent Harness从玩具到生产级的标志

GitHub上每天诞生数万个新项目。绝大多数连100个Star都拿不到。ECC(Agent Harness Performance Optimization System)在过去几个月拿到了20万颗Star,而且每天还在以大约1500颗的速度增长。这个数字放在整个开源生态里都极其刺眼。要知道,很多知名AI框架运营两三年才积累到这个量级。更值得玩味的是,ECC不是一个大模型,不是一款AI产品,甚至不是一个独立应用。它的定位是"AI代码编辑器的优化层"。

2026-06-10 08:08:51 235

原创 WWDC 2026:苹果AI终于迈出了这一步,但最大的赢家不是苹果

苹果花了两年时间,终于承认了一件事:在大模型这件事上,追不上就不追了。这听起来像是一次战略撤退,但仔细看WWDC 2026的AI布局,你会发现苹果没有撤退。它换了一条跑道。

2026-06-10 08:08:38 341

原创 Anthropic 9650亿美元IPO:AI编程工具的商业化拐点到了吗?

2023年初,Anthropic的估值是41亿美元。三年后的2026年5月,H轮融资完成后,这个数字变成了9650亿美元。涨了234倍。超越OpenAI成为全球估值最高的AI公司。但如果你只盯着这个数字看,就错过了真正重要的东西。真正值得关注的信号是:Anthropic从一个季度亏损数十亿美元的"烧钱机器",在2026年Q2首次预计实现5.59亿美元运营利润。季度营收从Q1的48亿美元跳到Q2预计的109亿美元,增速127%。

2026-06-10 08:08:20 220

原创 高考后想学AI:完整指南(暑假学习+专业选择+四年路线)

这篇文章写给三类人:刚考完高考不知道暑假干嘛的、正在填志愿纠结选什么专业的、马上入学想提前规划四年的。不贩卖焦虑,不灌鸡汤,只讲三件事:暑假该做什么、专业该怎么选、大学四年怎么走。读完大概需要15分钟。如果你现在手痒想直接学AI,可以直接跳到第二部分。

2026-06-10 06:11:09 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除