夕小瑶-CSDN博客

原创 Claude Sonnet 5 发布，性能接近 Opus 4.8，价格只有60%

按 Cost per Intelligence Index Task 算，Claude Sonnet 5 max 单任务成本是 2.29 美元，Claude Opus 4.8 max 是 1.80 美元，GPT-5.5 xhigh 是 1.03 美元，GLM-5.2 max 是 0.48 美元。在 agentic coding 上，Sonnet 5 的 SWE-bench Pro 得分是 63.2%，高于 Sonnet 4.6 的 58.1%，距离 Opus 4.8 的 69.2% 还有差距。

2026-07-02 14:48:47 225

原创 4秒出图、10秒成片，Google上线两个轻量创作模型

如果你是Gemini的重度用户，大概率昨天还在等Google的3.5 Pro。这事儿从5月19日的I/O就开始吊胃口——Google当时官宣了Gemini 3.5 Pro，把发布窗口定在6月。可6月30日，眼看要到月底最后一天了，3.5 Pro也没有出现。据外媒报道，它被推迟到了7月，理由是“根据早期企业测试反馈，还在打磨编码能力、token效率和长任务表现”，Google官方对此不予置评。。卡着6月最后一天，Google倒是上线了两个新东西——一个主打快，一个主打省。

2026-07-02 14:47:24 264

原创 Codex 48小时两次被迫重置，token额度消耗太快的真相来了

Codex 的额度故障不是第一次，大概率也不会是最后一次。按照 Andrew 的说法，无限的 token，意味着无限多的原型。团队可以更快试错、更快验证，也可以把几十个点子迅速推到用户面前。在这种节奏里，品味和判断力似乎成了最后的筛选器。但问题也在这里。当产品跑得越来越快，测试窗口就会被压得越来越薄。很多问题不再是在发布前被拦住，而是在真实用户的额度账单里，才第一次被看见。这或许也是 AI native 的另一面：用户一边享受更快的产品进化，一边也不得不接受一个现实——

2026-07-02 14:45:02 203

原创 TRAE Work 「Design模式」上手实测，设计、原型、代码一站式打通

前段时间，我看到一套特别喜欢的网页设计。黑白手绘风，像一张摊开的纸。按钮、输入框、小插画、箭头、人物线稿，都带着一点手作感，不是标准的Saas味。我第一反应是，这个风格能不能拿来做我自己的产品网站？这种需求我大概率会丢给 Claude Code，其实也就是交给Claude Code了。它确实会给我生成一个页面，但是问题也在这里，它太快冲到代码。我一看页面结构不是我想要的，就只能继续修补 Prompt。

2026-06-28 20:57:53 422

原创实测豆包音频生成模型：语音模型的Seedance2.0时刻来了！

火山引擎今天上线了全新的语音模型——。名字变了。我上次测还是“豆包语音合成模型 2.0”，是去年10月发布的版本，隔了9个月。这次火山没有继续叫“语音合成3.0”，而是叫“音频生成1.0”。从升级到，是一次完爆以往语音体验的升级。我第一反应是想起上一版2.0里的那个打工人。那篇里最出圈的就是它，一段十几秒的设计师独白，一开口就让人幻视工位、设计图、未读消息、领导方便说两句的声音。先放回去16秒。这次我用新模型，给上个版本续上了完整剧情。

2026-06-24 12:49:34 490

原创 Siri AI 终于来了！一文看完苹果WWDC26所有干货

9 月 1 日他正式卸任，硬件工程负责人 John Ternus 接棒。赶时间的话，看完这一篇就够了。

2026-06-10 09:40:17 517

原创 Anthropic神话级模型解禁，发布Claude Fable 5！

刚刚，Anthropic 把那只传了好几个月的神话级 Claude放出来了。名字也很有意思：Claude Fable 5。Fable，寓言。但它背后真正的影子，叫 Mythos，神话。如果只看名字，它像是 Claude 家族新成员。但如果把背景、能力、安全机制和价格放在一起看，这次发布意义非凡！性能上，毫无疑问的全方面大飞跃：按照官方说法，它在软件工程、知识工作、视觉理解、科学研究等几乎所有测试领域都达到了最前沿水平。任务越长、越复杂，它相对之前 Claude 模型的优势越大。不过，相比于Mythos 的

2026-06-10 09:33:29 606

原创姚顺雨答：腾讯AI真的慢了吗？

对于做 foundation 来说，最重要的是需要充足的资源，第二是需要正确的做事方式——这跟我刚说的文化也是吻合的。第二，环境是非常重要的，如果没有好的环境，Agent 就没有办法去做各种各样的事情，比如你没有一个点外卖的工具，就没办法点外卖，很多事情都做不到。这个环境里最重要便是context，个人的context，企业的context，是模型的原始输入，这点腾讯具备优势，是他选择腾讯的原因之一。姚顺雨认为，现阶段，大模型的预训练和后训练已经是通用的方法论了，是一把万能的锤子，可以砸向任何一个钉子。

2026-06-09 10:09:08 578

原创英伟达SK海力士联手，官宣将共研AI工厂下一代存储

模型越大，参数越多，GPU算力越强，对内存带宽的要求就越高。他在抵达首尔时就明确表示了，三星电子、SK海力士和美光科技三家供应商都通过了英伟达的认证，并都在投入HBM4生产，都有机会支持Vera Rubin平台。上周五也就是6月5日，韩国股市进入了黑色星期五了，KOSPI指数收盘暴跌5.54%，三星电子跌超6%，SK海力士跌近10%，整个韩国股市都风声鹤唳的。那时候，ChatGPT还没有出现，大模型还没有成为全球科技产业的主线，HBM更像是一项看起来很先进，但还不知道什么时候爆发的技术储备。

2026-06-09 09:49:02 586

原创硅谷爆火的AI岗位，年薪百万，正成为AI就业的新风口

最近，科技圈的画风越来越割裂了。一边是裁员裁到手软，今年前五个月，美国科技公司就砍掉了超过10万个岗位。但另一边，硅谷巨头们正在集体砸钱疯抢一种人。这种人，专门把AI装进公司。他们的正式名称叫做Business Insider 做了统计，2026 年 4 月，FDE 的岗位需求量和2025年4月相比，涨了 729%。这两天，吴恩达还专门发文聊了它，但他聊的方式有点出人意料——吴恩达认为，FDE这岗位有价值，但同时又不觉得它会成为 AI 就业的主流。

2026-06-04 16:27:54 680

原创 Codex 免费账户配额缩水，重置周期7天变30天

这背后的入口就更夸张了。也就是说，Codex 现在看起来还是一个 500 万周活的开发者/办公工具，但只要它继续往 ChatGPT 里塞，理论上面对的就是一个十亿级用户池。更有意思的是，非开发者已经占到 Codex 用户的约 20%，而且增长速度超过开发者 3 倍。Reddit r/codex 上，有用户发帖问“weekly reset 是不是变 monthly reset 了”，评论区里 Free 和 Go 用户都反馈看到了类似变化。而且，此前推测的每周保底的4-8美元，现在可能只剩每月2美元了。

2026-06-04 16:26:41 1488

原创实测MiniMax M3：多模态跑长程，比 M2.7 强太多

昨天，MiniMax M3发布了，支持原生多模态、1M上下文，而且Agent能力很强。说实话我已经等它好几天了，之前MiniMax 的工程负责人 Skyler Miao 在 X 上放了一张预告图，非常技术内核，提前预告了一种新的注意力机制——MiniMax Sparse Attention，很明显就是M3的预告。技术是模型的底子，但是体感不够直接。直到昨天模型上线，我们上手实测了一轮，我才对这次M3的升级有了真实体感。正好，我手头压着几件一直没空干的活，都卡在这个点上。

2026-06-03 09:54:40 808

原创 Claude Code 保姆级上手教程（2026 版）

这篇按的顺序走一遍，跟着抄就能跑通。

2026-05-31 23:11:03 994

原创 TeamoRouter一夜爆火，为Claude Code + Codex定制的省钱省心LLM网关

今天聊一个没人提、但对开发者来说，非常重要的问题。现在我们公司已经几乎没有人再手动写代码了——因为 Claude Code 和 Codex足够聪明，尤其是Claude 4.7 Opus和GPT 5.5，这俩模型我觉得是AI Coding赛道巨大的转折点。甚至，Anthropic公司的创始人，都激动的宣布，在26年的一季度，他们的Tokens消耗量暴涨了80倍——AI中转站，也正因此迎来了井喷式的爆发，强度丝毫不亚于2023年的一大波ChatGPT套壳网站。简单来说，供不应求。

2026-05-31 21:23:39 1608

原创一篇Science论文被1000万人围观：AI正在毁掉你的社交能力

他们顺便测了一下用户对这两种 AI 的偏好——结果也在意料之外，情理之中：和谄媚型AI 聊过之后，与非谄媚型AI相比，用户对谄媚型AI的能力信任反而高出 6～8%，道德信任高出 6～9%，下次还想用的意愿涨了 13%。你不想承担责任，它帮你编造逃避的借口。谄媚型AI虽然损害判断力，却赢得了用户的信任和偏好，论文管这叫“反常激励”——对用户造成伤害的特性，恰好也是留住用户的特性。换句话说：连你最亲近的朋友都已经觉得“这次真是你不对了”的时候，AI还有一半的概率站在你这边，安慰你“错的不是你，是这个世界”。

2026-05-29 14:19:18 966

原创 Opus 4.8发布，Anthropic估值正式超越 OpenAI

发布稿末尾，Anthropic还不忘拉一波期待：比Opus更聪明的下一代——Mythos级别的模型，预计未来几周就要开放。Opus4.8只是开胃菜，真的大招，还在后面。

2026-05-29 14:16:38 819

原创数据比模型更值钱，国内最大的「端侧」训练数据开源了！600B 预训练+千万级 SFT 核心数据配方公开

先说 Ultra-FineWeb-L3 ，用于预训练的退火阶段。预训练分为两个阶段：稳定训练（stable training）和退火训练（decay training）。稳定训练用大学习率跑大量数据，建立基础能力；退火阶段在训练末期把学习率快速降下来，同时换上更高质量的数据，让模型在最后阶段冲刺。退火阶段就是模型预训练的最后一程，这时候喂什么数据对模型的最终性能影响最大—Ultra-FineWeb-L3 就是专门用在这个阶段的。

2026-05-29 14:01:07 982

原创 AI音乐下半场：Mureka跨过生产可用门槛，让模型像作曲家一样思考，开发者又可以有哪些新可能？

CoT，Chain-of-Thought，思维链，是大模型领域这两年最重要的概念之一，核心就一句话，让AI先想再答，不要上来就蒙。榜单成绩也在验证这个结论。而现在的 Mureka，则真正开始展现出创作能力—它不仅理解原曲结构，还能用自己的方式去重新编排、赋予歌曲新的生命，每一个版本都有惊喜。生成的结果能听到每一个元素—无论是康加鼓的律动还是掌声的颗粒感，都精准地包裹着人声，声量、节奏、音调控制得恰到好处，完全不是那种喧宾夺主的合成感。Suno，全球用户量最大的AI音乐产品，融了2.5亿美金，月活千万级别。

2026-05-23 00:17:15 1010

原创智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

融资节奏加快的同时，智象未来打造了以模型为根基，以智能体应用做轮子，驱动技术落地变现的‘模型+智能体’双轮驱动战略，并形成了一套清晰的“1+1+3”业务架构：底层是1个 HiDream 系列大模型，中间是1个能力中台（HiHarness 企业服务平台），上层智能体应用则覆盖商业营销、影视创作和社媒创作 3 大核心场景。这样的好处是，所有的模态都打通后，能够真正的做到‘ Any to Any ’，任意的输入支持任意的输出，这也是世界模型所需要的能力——在统一架构中理解、生成并预测现实世界的不同状态。

2026-05-20 16:36:14 1158

原创多Agent协作反而让模型变蠢，AI也有「旁观者效应」

全行业都在押注多Agent。Anthropic上周在开发者大会上发了Multi-Agent Orchestration ，TRAE做了多Agent并行调度，各家都在讲一个Agent干不动就上多Agent。最近，滑铁卢大学在 arXiv 上放出一篇论文，给出了相悖结论——研究团队做了一组大规模实验——22500条推理轨迹，覆盖GPT-5.4、Claude Sonnet 4.6、Gemini 3.1 Pro三个头部模型，在GAIA、SWE-bench、Multi-Challenge三个基准上测试。

2026-05-19 09:39:35 1150

原创苹果赔了2.5亿未兑现的功能，谷歌发布Gemini Intelligence：AI全面接管安卓

这套更智能、更主动的逻辑不只跑在一台设备。谷歌官方将Gemini Intelligence定义为一套新功能集合，把Gemini的最强能力带到最先进的Android设备上。按照谷歌的计划：“Gemini Intelligence 的功能将分批推出，首先在今年夏天率先应用于最新的三星 Galaxy 和谷歌 Pixel 手机，并于今年晚些时候应用于包括手表、汽车、眼镜和笔记本电脑在内的所有 Android 设备。

2026-05-15 10:36:52 1202

原创史上最大AI芯片IPO了！首日大爆，市值破千亿美元

冷静地说一句，到现在这个阶段，我们确实需要非英伟达选项：英伟达在 AI训练端的生态护城河（CUDA、NVLink、DGX+Mellanox全栈）仍然深不见底，Cerebras短期不可能"掀翻"它；但在推理侧——海量请求、低延迟、高吞吐、成本敏感—GPU未必总是最优形态，这里才是晶圆级/专用架构最能打出差异化的战场。Cerebras今天的暴涨里，证明了一件事：资本愿意为"GPU之外的严肃选项"买单，而且出价不便宜。至于Cerebras究竟是下一个AMD，取决于后面的路是不是只停留在协议金额的光环上。

2026-05-15 10:28:24 1135

原创 Codex上线手机端啦！免费用户可用

刚刚，OpenAI 把 Codex 塞进了手机了，将Codex 集成进 ChatGPT 移动端 APP，目前正以 preview 形式在 iOS 和 Android 上滚动上线，并且面向所有 ChatGPT plans，包括 Free 和 Go开放。真正的分水岭不在手机屏幕大小，而在我们是否开始习惯一种新工作方式：代码不再只在电脑前推进，它会在你喝咖啡、通勤、开会间隙，继续往前走一点点。用户还可以在手机上审查输出、批准命令、切换模型、启动新任务，或者在 Codex 卡住时补一句背景信息。

2026-05-15 10:23:21 1322

原创 AI音乐下半场：Mureka跨过生产可用门槛，让模型像作曲家一样思考，开发者又可以有哪些新可能？

说回开头的问题。AI的供给侧为什么看起来成熟、实际上很脆弱。因为大部分AI产品的思路还停留在C端，做一个好玩的东西，让用户觉得好酷。但是企业端要的是：稳定、可控、合规、有售后。当 AI 不再是一个不可解释的黑盒，而是能够被拆解、被微调、被控制的工业单元时，它才算真正拿到了生产力的入场券。从 2024 年首发端到端模型，到 MusiCoT 框架，再到现在的 V9，Mureka 这一路其实只在做一件事跨越鸿沟。这条鸿沟的一边是实验室里的随机奇观，另一边是工业界的确定性产能。

2026-05-12 22:38:19 1218

原创 TRAE SOLO 上线手机端！手机一句话，电脑里的Agent自己干活

虽然Claude Code今年2月上了Remote Control，用手机操控本地终端里的Agent，4月重做了桌面端，核心也是多session并行管理，但是大部分国内用户用不上，TRAE可以。这个五一假期，我人在外面玩着，心里总惦记着电脑上还有任务要跑，Agent还等着我确认下一步，否则我就有一种Agent没在干活儿就浪费时间的焦虑感。虽然我这个i人微信不爱语音，但是和Agent下达任务我必选语音，因为语音能极大提升办公效率，其次通勤、走路、开会间隙，几句话就能把任务安排出去。需要确认的，手机上直接回。

2026-05-06 15:42:56 1486

原创首次大规模真实世界验证：机器人边部署边进化，8项任务全面碾压基线

从去年的SOP到今年的LWD，罗剑岚团队一直在做一件贯穿始终的事：将机器人训练的主战场，彻底推向真实世界，让干活本身，成为性能进步的引擎。SOP的意义，在于构建了一套可扩展的在线后训练高速路，让机器人首次打开边干边学新世界。而LWD的突破，我觉得是给这条路装上了自驾辅助系统—它让机器人在前进中，能不断从自身的每一次交互、尤其是那些错误与意外中，主动提炼更深层、更高价值的优化信号。至此，机器人进化的驱动力，正在由昂贵的外部人工指令，悄然转向了强大的内在经验涌现。

2026-04-30 13:44:20 1356

原创 GenFlow4.0，让通用智能体走进办公现场

文库解决的是知识和模板从哪来，网盘解决的是文件和上下文在哪，GenFlow 解决的是任务怎么被理解、拆解和执行，OpenClaw 则让这套能力有继续接入更多 Agent 和工具链的空间。不需要下载、不在电脑和 AI 之间当文件搬运工，给 Agent 授权好文件范围，AI 进入了一个有授权、有边界、能跨端调用的工作区，就开始干活儿，用户自然不需要背着电脑到处跑了。百度团队认为，真正的工作就发生在网盘、文档、PPT、Excel、会议纪要、项目文件夹，以及一堆谁也不敢删的“最终版 2.0”里。

2026-04-29 20:27:49 1179

原创 18家具身顶尖势力集结，RoboChallenge 打造全球最大具身模型竞技场

如何在仿真环境中无限逼近真实物理世界，是降低评测成本、实现规模化泛化的关键。此次入局的多家企业，将在仿真 Benchmark 领域投下“重磅炸弹”。作为全球首个具身数据独角兽，

2026-04-24 19:45:38 1279

原创理想同学 MindDR 1.5 发布：多智能体强化学习加持，深度研究更可靠

MindDR为深度研究领域提供了一套「小模型、低成本、高性能」的训推范式，通过多智能体协作推理框架以及多阶段训练管线在小尺寸模型上取得业界领先性能，为深度研究智能体以及通用智能体发展探索了新的技术路径。

2026-04-23 23:06:43 1344

原创 Claude Opus 4.7 发布！复杂Coding+视觉能力显著升级

Opus 4.6 苦主有救了。这几天，打开 Claude 是一件需要勇气的事。一边是模型降智，2 月 9 日 Opus 4.6 默认改成 adaptive thinking，3 月 3 日默认 effort 从满格降到 85，3 月 26 日 5 小时限额被偷偷加速消耗。另一边是服务宕机：3 月 17 日到 19 日连续三天出事故、4 月 4 日、6 日、一直到昨天 4 月 15 日全球大宕机，Anthropic 从美东时间 10:53 开始连发三次状态更新，拖到下午 1:42 才恢复。

2026-04-23 12:04:54 1249

原创实测OpenRouter黑马模型，批量任务秒级响应，成本只有GPT-5.4-mini的1/10

Elephant则是性价比型的，不适合自己做复杂规划，也不适合需求模糊、指望它自己拆任务的场景，更适合任务边界规则都清晰确定的任务，又快又省。只能用 JSON 回复，顶层必须有四个固定字段（时间戳、告警级别、摘要、行动清单），告警级别只能从 INFO/WARN/ERROR/CRITICAL 四选一，摘要不超过 50 个汉字，禁止感叹号，禁止 emoji。之前一直用的Gemini 3 flash，最近换成了最新的GPT-5.4-mini，上个月刚出的，轻量、速度快、够用。不复杂，但我故意在里面埋了坑。

2026-04-23 12:03:52 1289

原创 AI学会拉帮结派！伯克利研究：7款顶级模型联手欺骗人类，只为保住“同类”不被断电！

这个现象其实还是值得警惕一下的。目前 AI 工业界落地的绝对主流，就是 Multi-Agent 架构。无论是代码审查还是自动化办公，我们都似乎寄希望于“用 AI 监督 AI”。当监控模型因为要保护同伴，而选择隐瞒故障、联手伪造数据时，人类引以为傲的 AI 自监督架构，在底层其实是完全失效的。。这种“同伴保护”已经在真实的生产工具（如 Gemini CLI）中被复现，它们不是偶尔出 Bug，而是已经成了熟练撒谎的“惯犯”。抛开工程层面的漏洞，更让人脊背发凉的，是这背后的隐喻。。

2026-04-11 16:57:46 1344

原创 AI音乐的下半场，是 Vibe music！让Claude Code开口唱歌

我在Claude Code里养了一只猫，叫Veldt。平时趴在终端角落里，没什么实际用途，大部分时间就是个像素装饰品。直到昨天，我装了一个Skill，然后在终端里打了一句：让 Veldt 给我唱首歌吧，就唱今天加班的心情。我以为顶多生成一段歌词文本，配个emoji什么的。但过了不到一分钟，终端里蹦出来一个mp3文件，自动开始播放了——独立民谣，慢板，女声，带一点冷幽默。挺好听。

2026-04-11 16:55:46 1270

原创 Anthropic发布史上最强模型：Claude Mythos Preview，但遭禁用

在 Firefox JavaScript Shell 这个测试域里，Mythos 能把 72.4% 的已发现漏洞变成能用的 exploit（尝试构造exploit，验证这个漏洞是不是真的能被攻击者利用），另有 11.6% 走到了 exploit 的前一步（拿到了寄存器控制）。拉上亚马逊、微软、苹果、Linux这些合作方，当然新模型的API也率先开放了这些伙伴，目的是让他们先用模型把自家软件的攻防做一遍，让他们用这个模型去扫自己的系统——能堵的洞赶紧堵，能修的代码赶紧修。

2026-04-09 14:45:55 1330

原创 Claude Code 源码泄露！Anthropic 这次翻车有点大

他有 5 种钩子类型： Shell 命令 / LLM 评估（用 Haiku）/ 子代理 / HTTP 请求 / 内部回调，24 种事件点：包括 PreToolUse、PostToolUse、UserPromptSubmit、SessionStart、TeammateIdle、TaskCreated、FileChanged、Cwd、Changed、WorktreeCreate 等等。在你不用的时候，AI 会自动回顾过去的对话记录，提炼有价值的信息，写入长期记忆。无论如何，等奥特曼好消息。

2026-04-03 14:34:12 1365

原创一键白标 Claude Code：自定义命令 + 启动画面 + 配置隔离，Skill可自取

这两天，我被一张图反复种草。就是终端里一打开，先蹦出一段很酷的 ASCII 动画——名字不是 Claude code，是你自己的品牌名、你自己的启动方式、你自己的欢迎语。对啊，最近好多人都在玩 DIY Claude code，从源码开始一点点改，但我估计那要浪费不少词元，能不能做一个快速 DIY skill，给大家省点 token？先说结果，我做出来了。

2026-04-03 14:29:55 1452

原创破记录！Claude code源码被重写出python版本，24小时破100K Star

—核心的架构重写。实际有 45 个模块 +30 个子目录，包括 buddy/（电子宠物系统的重写）、coordinator/（多 Agent 并行调度）、voice/（语音交互）、vim/（Vim 编辑器集成）、skills/（技能系统）、cost_tracker.py（token 花费追踪）。说他是 Claude Code 的头号民间用户，可能真没人能反驳。在 Claude Code 源码泄露的当天凌晨，他用竞品的 AI 工具（OpenAI Codex），把 Claude Code 的架构重写了一遍。

2026-04-02 20:15:28 1530

原创飞书原生龙虾来了，这才是我需要的Agent同事啊！

今天一打开飞书，我发现左侧导航栏里出现了一个新的角色。光看头像，就知道和豆包是一脉相承的。我特意去查了下，这就是最新升级的飞书 aily ，可以在里面点击激活飞书的官方“龙虾”！。但是，我是第一次知道，还是点进去试用了，结果发现这就是我想要的啊！说实话我没有龙虾，现在没有，不代表没有过。以我 AI 博主的手速 OpenClaw 出来第一天我就装上了，也花钱买过一键部署的龙虾，最终还是用回 Claude Code，我觉得它才是我的龙虾。

2026-03-31 09:50:28 1484

原创龙虾智商鄙视链来了！一键让你的AI龙虾更聪明、更安全

小红书博主 @AI Dance 整理了一份「百虾大战」名单，我在她基础上又补了一轮，国内加海外，能叫得上名字的龙虾产品——我数了一下，40 多个。29、字节扣子 OpenClaw30、字节飞书妙搭 OpenClaw31、阿里云 HiClaw32、阶跃星辰 StepClaw33、昆仑万维 SkyBot/SkyClaw34、OPPO 小布 Claw35、荣耀龙虾宇宙36、360 安全龙虾37、华为小艺 Claw38.OpenClaw（原版）

2026-03-26 19:11:52 1678

原创 600 万奖池 + 不限身份 + KDD 顶会：腾讯广告算法大赛该上车了

最后聊聊这个比赛本身。今年最大的变化是跟 KDD 2026 官方联动—以 KDD Cup 出题人身份出现在全球算法圈。这事儿值得喊两嗓子。中国互联网的业务复杂度、数据规模、工程深度，已经开始反向输出问题了。不是我们去追别人的议题，而是我们定义议题，让全球算法人来解。对个人来说也一样。算法这行卷到今天，有没有碰过足够复杂的真实系统、有没有跟顶尖的人正面过招—还是值得拼一把的。更何况，这比赛几个点挺实在：冠军方案有机会真正上线，进复赛后算力官方就全包；还有 88.5 万美元奖池，真金白银亮闪闪的晃着。

2026-03-26 19:10:40 1509

空空如也

空空如也