- 博客(20)
- 收藏
- 关注
原创 MindSpore vs PyTorch实测对比:同一任务下的性能差异分析
MindSpore这两年进步很快,2.x版本的API比1.x好用多了,Graph模式的编译速度也在持续优化。但跟PyTorch相比,生态差距还是最大的短板——不是框架本身不好,而是用的人少就导致第三方资源少,第三方资源少又导致新用户更倾向选PyTorch,形成了循环。打破这个循环需要时间,也需要更多开发者实际上手试一试。我写这篇对比,也是希望给还没用过MindSpore的人一个参考——至少在性能层面,它没有落后,某些场景下还有优势。如果你手上有昇腾的卡,强烈建议试试MindSpore + 昇腾的组合。
2026-04-03 09:34:41
507
原创 DeepSeek本地部署+API调用实战:从Ollama到vLLM,我踩过的坑全在这
DeepSeek V3/R1本地部署全流程,Ollama零门槛上手、vLLM生产级部署、官方API调用实战,含Function Calling代码和踩坑记录
2026-04-03 09:29:51
415
原创 OpenAI Agents SDK 实战:用 Python 写一个多 Agent 协作系统
这个 SDK 的优点是 API 薄,上手快,三个概念够用。比 LangGraph 的学习曲线平很多,代码也好读。限制在于对非 OpenAI 模型支持不太好。Responses API 是 OpenAI 独有的,切到 Chat Completions API 后有些功能(比如 Guardrails)用不了。如果你的项目需要混合多家模型,LangGraph 或 CrewAI 可能更合适。代码都测过能跑。有问题评论区聊。
2026-04-02 11:08:04
525
原创 512,000行源码全曝光:Claude Code 内部架构深度剖析
3月31日,安全研究员 Chaofan Shou 发现 Anthropic 的 Claude Code CLI 在 npm 包 v2.1.88 中夹带了 source map 文件。这个文件里嵌着完整的原始源码——512,000行TypeScript,将近1,900个文件,从agent架构到system prompt,一行不少。出事原因很简单:Bun打包器默认生成 .map 文件,而 .npmignore 里没排除。就这么一个配置疏忽。
2026-04-01 12:30:15
618
原创 只看截图就能操控网页?MolmoWeb本地部署实测,附完整代码
上周 Ai2(Allen AI研究所)放出了 MolmoWeb,一个开源的视觉 Web Agent。跟以前那些靠解析 HTML DOM 来操作网页的方案不同,MolmoWeb 直接看截图,跟人一样看屏幕,然后决定点哪里、打什么字。我花了一天时间把它跑通了。这篇文章记录整个过程:从环境搭建到模型加载,再到实际让它完成一个网页搜索任务。踩了几个坑,也有一些超出预期的地方。
2026-04-01 11:19:40
584
原创 给 AI Agent 装上记忆:三层架构实战,附完整 Python 代码
会话层管"当下",文件层管"身份",检索层管"历史"每层用最简单的技术实现,别过度设计定期整理,让 Agent 自己维护记忆(类似人类睡眠时的记忆整合)完整代码放在上面了,复制下来改改路径就能跑。如果你在搭建自己的 Agent,记忆系统是最值得花时间的基础设施——没有记忆的 Agent 只是一个高级聊天框,有了记忆它才开始像一个真正的助手。
2026-03-31 23:26:11
685
原创 每次开 Claude Code 都要重新解释项目?claude-mem 帮你搞定跨会话记忆
claude-mem 的核心思路很简单——Claude Code 不记东西,那就在旁边放个笔记本帮它记。5 个 Hook 自动捕获,SQLite 存储,向量搜索检索,下次 session 自动注入。实际用下来,对连续开发同一个项目的场景确实省事。但配置需要调,token 消耗需要控,向量搜索的相关性还有优化空间。装完打开确认 worker 在跑就行。
2026-03-30 11:03:58
682
原创 DeepSeek本地部署+API调用实战:从Ollama到vLLM,我踩过的坑全在这
DeepSeek的出现让"本地跑大模型"从极客玩具变成了实用工具。V3的MoE架构在保持高性能的同时把推理成本砍到了传统Dense模型的几分之一。R1的推理链机制在复杂任务上表现让人惊喜。我每天实际在用的组合:笔记本上Ollama跑R1 14B处理日常开发问题,云端API V3处理多平台内容生成任务。两个月下来API费用不到50块钱。如果你也在做AI相关的开发,DeepSeek值得认真试试。不一定要替代GPT-4,但作为高性价比的补充方案,已经足够好了。
2026-03-30 09:48:06
848
原创 Goose实战:0元跑起来的AI编程Agent,我用它替代了Claude Code一周
Goose不是Claude Code杀手,但它给了开发者一个真实可用的选择。开源、免费、跑在本机、支持任意模型——这些特性放在一起,比"更强的模型"对很多人更有吸引力。装一下试试,10分钟就能跑起来。反正不要钱。GitHub地址:github.com/block/gooseOllama地址:ollama.com。
2026-03-29 11:03:53
648
原创 用 Superpowers 给你的 AI 编程 Agent 装上纪律,从安装到跑通一个完整项目
你有没有遇到过这种情况:让 Claude Code 帮你写一个功能,前几轮对话还挺好,越往后越跑偏?文件改多了它就忘了之前的设计,测试是补上去的不是先写的,最后 review 代码发现一堆和需求不沾边的东西。我上周就被坑了一把。一个跨 15 个文件的功能,Claude Code 写到一半开始乱改之前的代码,最后不得不手动回滚 git 重来。这周试了 Superpowers 框架,同样的任务,它让 Claude Code 自主跑了两个小时没偏离计划。这篇文章把整个过程写出来,你看完直接能用。
2026-03-26 11:15:43
793
原创 用了4个月Claude Code后,我换成了OpenCode
OpenCode不是什么革命性的东西。它解决的问题很具体:别把自己绑死在一家模型上。2026年的AI编程工具市场变化太快了。去年此时Cursor还是绝对主流,现在大家都在CLI里写代码了。哪家模型明天会降价、哪家会限流、哪家会发布新版本改掉API——你控制不了。但你可以选择一个工具,让切换成本接近于零。文档:https://opencode.ai/docs本周v1.3.0更新日志:https://github.com/anomalyco/opencode/releases/tag/v1.3.0。
2026-03-25 11:19:42
911
原创 Claude Code Hooks 实战:6个配置搞定代码格式化、安全防护和自动测试
用过 Claude Code 的人都知道一个痛点:你告诉它"每次改完文件跑一下 Prettier",它有时候记得,有时候忘。你说"别碰 .env 文件",它大多数时候听话,偶尔手一滑就给你改了。这不是 Claude Code 的 Bug,是 LLM 的本性——概率模型,天生不确定。Hooks 就是解决这个问题的。它是 Claude Code 内置的生命周期脚本,在特定节点自动执行,不依赖 AI 的"记忆力"。你配一次,它每次都跑,跟 Git Hooks 一个道理。我用了两个月,踩了不少坑。
2026-03-24 11:18:18
2584
原创 Claude Code 10个隐藏技巧:大部分人只用了它10%的能力
10个技巧串起来:Session预热省token,Worktree并行省时间,CLAUDE.md省纠错,Plan模式省返工,SubAgent省精力,Effort级别省钱,上下文压缩保状态,感叹号省切换,Hooks做自动化,Ctrl+G提升提示词质量。打开终端,输入需求,等它吐代码,复制粘贴。这样用下来,你大概只发挥了它10%的能力。分叉出来的Session继承完整的上下文,但各自独立,不会互相干扰。建议今天就做三件事:给你的项目创建CLAUDE.md,试一次Plan模式,配好Git Worktree。
2026-03-23 13:03:40
915
原创 AI周报实测:GPT-5.4 Computer Use上手体验 + Nemotron 3 Super本地部署踩坑
黄仁勋穿着万年不换的皮夹克,做了件所有人都没料到的事——把原定2028年才发的Feynman架构,提前拿出来秀了一把技术原型。这个操作本身就很耐人寻味。Blackwell是2024年发的,Vera Rubin今年下半年量产,Feynman按节奏应该是2028年的事。提前两年展示,摆明了告诉AMD和一众AI芯片公司:你们追我上一代的时候,我下下代已经做出来了。Feynman几个硬指标:台积电A16制程(1.6nm),英伟达第一次进入1nm级别。
2026-03-21 08:27:18
732
原创 Claude Code Security实测:20分钟挖出Firefox高危漏洞,我自己的项目也试了
Claude Code Security让我印象最深的不是22个漏洞这个数字,而是它审查代码的方式——不是匹配已知模式,而是理解代码的逻辑和意图。对个人开发者来说,你第一次可以用接近专业安全审计的质量审查自己的代码,成本几乎可以忽略。对安全行业来说,只靠规则库吃饭的工具确实需要重新想想定位了。AI不会替代安全工程师。但不用AI的安全工程师,会被用AI的安全工程师替代。关注公众号 92year,每天一篇AI工具深度实测。
2026-03-20 08:28:32
749
原创 Claude Code 3月最大更新:这几个新功能你今天就该试
Claude Code 上周更新到 v2.1.76,同时 Anthropic 把 100万 token 上下文正式开放了,不加价。一句话:现在是上手 Claude Code 最好的时机。这篇不写代码,只讲操作。你跟着打开终端,5分钟就能把这些新功能用起来。
2026-03-19 09:10:37
1253
原创 一周涨了10万星:编码Agent框架到底在卷什么?
编码Agent框架的爆发,本质上是开发者从"用AI辅助写代码"进化到"用AI自主交付代码"。这个转变不可能一步到位——Superpowers那套流程之所以管用,恰恰是因为它限制了Agent的自由度。当下的编码Agent更像是一个纪律性极强的初级工程师:给它清晰的spec、足够的测试、隔离的环境,它能稳定产出。但指望它自己做架构决策、理解业务上下文?还早。好消息是,框架层面的问题正在被快速解决。半年前我们还在纠结"Agent怎么读文件不出错",现在讨论的已经是"怎么让十个Agent协同重构一个大项目"。
2026-03-19 09:06:13
185
原创 编码 Agent 正在学会「自我进化」——从 Superpowers 到 OpenViking 的技术拆解
OpenViking 的野心大得多。它不是做一个记忆插件,而是要做 Agent 的「上下文数据库」。传统 RAG 的做法是把文本切片、向量化、扔进向量数据库。检索的时候用余弦相似度捞出来。问题在于——这是扁平的。你查「用户认证」,它可能把登录、注册、OAuth、JWT 全给你捞出来,但没有层次关系。OpenViking 用「文件系统范式」来组织上下文。记忆(Memory):对话历史、决策记录、经验教训资源(Resource):文档、代码、数据技能(Skill):可复用的操作模式。
2026-03-17 11:08:44
784
原创 我用 AI Agent 搭了一套多平台自动分发系统,踩了这些坑
这套系统的核心不是某个具体技术,而是分层的自动化策略有 API 用 API(最稳定、维护成本最低)没 API 用无头浏览器(Puppeteer + Stealth,适合大多数场景)反爬严格就复用真实浏览器会话(AppleScript 注入,兜底方案)每增加一个新平台,先评估它属于哪一层,再选择对应的技术方案。不要试图用一种方案覆盖所有平台——每个平台的反爬策略、编辑器实现、API 开放度都不同。- 接入 Medium、Dev.to 等海外技术社区(它们有友好的 API)
2026-03-16 10:50:25
982
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅