自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(107)
  • 收藏
  • 关注

原创 老金开源了个支持含CC、Codex等4个平台的编程治理框架

这篇文章介绍了Meta_Kim项目,这是一个为AI编程工具设计的元架构系统,旨在解决当前AI编程中存在的组织和管理问题。作者指出,现有AI工具虽然能快速生成代码,但缺乏有效的分工、审查和经验沉淀机制,导致项目容易混乱。Meta_Kim通过将AI任务分解为可治理的最小单元(agent),实现了记忆隔离、上下文隔离和技能隔离,使不同AI角色能够各司其职。该系统已在Claude Code等四个平台上实现,并发表了相关论文。文章强调,真正的挑战不在于AI的能力强弱,而在于如何组织和管理AI协作,这正是Meta_Ki

2026-04-29 12:48:49 375

原创 不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源

春节那几天,老金我干了一件自己都没想到的事。不懂代码,不懂英语,对着电脑说了几天话,喷出来一个完整网站。前后端分离、国际化、第三方登录、第三方支付、数据库、后台管理,全有。不信你自己去看:aiking.dev​​老金我爸妈都觉得不可思议:“你啥时候会写代码了?老金我说:“我不会,但我有武器和助理。武器是 Claude Code,助理是 OpenClaw。这两个工具,老金我之前分别写过教程。但用了两个月之后,老金我发现一个事儿——它们分开用,只能发挥一半的威力。

2026-02-25 14:35:51 932

原创 公众号写作2年,从几十到几千阅读量,我靠这3件事做到的

今天是除夕,老金我坐在书房,想写点东西。回顾这2年——从24年1月开始写公众号,从几十阅读量到现在的几千阅读量,老金我用实际行动证明了一件事:认真记录、真诚分享,真的能影响一群人。2026年是马年,也是老金我的本命年。马这玩意儿,奔腾、突破、有冲劲。老金我觉得这正好是AI时代需要的特质——敢闯敢试,快速迭代,不怕失败。本命年嘛,老金我得更拼一点。

2026-02-16 15:31:38 2064

原创 老金开源10万字Claude Code中文教程,零基础到企业实战完整路径

老金耗时3个月完成10万字的《Claude Code中文教程》,包含10个完整教程、70+实用代码示例和120个常见问题解答,全部免费开源。教程从零基础到企业实战全覆盖,特别针对中文用户的学习痛点设计。作者还预告将在春节期间开源"Agent Team Skill"功能,实现多AI代理的智能协作。该项目旨在降低AI编程工具的使用门槛,让更多人体验AI带来的效率变革。教程已发布在GitHub,欢迎开发者使用和反馈。

2026-02-12 13:06:56 1563

原创 GLM-5.2来了,Claude Code百万上下文怎么配?

智谱发布GLM-5.2模型,重点升级了1M上下文能力,显著提升长任务处理效果。该版本支持Claude Code工具链,配置时需在模型名添加[1m]后缀并设置压缩窗口参数。实测显示原生WebSearch功能可用,建议优先使用。作者建议分阶段测试1M上下文效果:先理解项目结构,再做小范围修改,逐步验证长程记忆能力。目前GLM年费Pro版有5%优惠,标志着国产模型正从参数竞赛转向实用工具集成。

2026-06-13 21:53:48 1318

原创 用ChatGPT管项目,让Codex只做Ticket

本文讨论了如何有效利用AI工具(如ChatGPT和Codex)进行项目开发,强调控制项目范围的重要性。核心观点包括: 避免直接让AI"Build my app"的许愿式提示词,这容易导致项目失控 建议采用分工协作方式:ChatGPT负责规划架构,Codex负责具体实现 提出"最小可治理化"原则:将项目拆分为5-10分钟可验收的小任务 详细介绍了项目文档包(README.md、AGENTS.md等)的创建和使用方法 强调每次任务完成后的报告机制,确保项目状态可控 文章通过个人读书记录工具的例子,展示了如何应用

2026-06-10 16:24:45 240

原创 元:我在Cluade Code和Codex做了实测,开源给大家用用,它是万能底层基座

回到开头那个问题:AI写代码够快了,但完成一件事够不够格,没人管。Meta_Kim解决的是这一类问题。它不是让AI更强,是让AI做完事以后能被检查。假完成有证据可查,乱分工有规则可走,乱沉淀有判断可拦,乱吹兼容有边界可守。如果你只是让AI改个按钮颜色、换个文案,Meta_Kim没必要。直接用Codex、Claude Code就够了。

2026-06-08 14:02:11 265

原创 AI会为人打工,但不一定会为你打工,老金来告你真相是什么

本文探讨了AI时代下人与工具的关系,指出当前普遍存在的"AI许愿"误区。作者将AI使用者分为四层:许愿型、外包型、协作型和系统型,强调真正有价值的是建立认知闭环而非单纯依赖工具。文章提出,AI发展不是替代人类思考,而是倒逼认知升级,关键在于定义问题、拆解流程和验收结果的能力。建议从业者从具体可落地的任务入手,先让AI接管小流程再逐步扩展,而非追求不切实际的"全自动硅基员工"愿景。最终结论是:AI是认知放大器,唯有持续学习并建立系统思维的人才能享受技术红利。

2026-06-05 19:45:31 234

原创 Codex大更新,咱普通人怎么用它交付工作

Codex这次最值得看的,不是某一个按钮多厉害,而是它把 AI 工作流拼起来了。插件负责让Codex进岗位和工具。Sites负责把团队工作区里的结果变成可打开的产物。Annotations负责让人更精细化的准确判断调整,而不是每次重新生成。Computer Use负责处理那些没有结构化接口、但又真实存在于屏幕上的工作。​这也是老金我一直更相信的人机协作。人负责目标、判断、边界和验收。AI 负责搜索、整理、执行、生成和修改。

2026-06-04 17:57:28 241

原创 Codex顶级邪修!配合Coze3,组合Claude Code!躺着玩手机的手把手教程!

本文介绍了Coze 3.0与Codex、Claude Code的联动玩法:1)Codex的"邪修"多线程功能,可创建多个任务窗口并实现主窗口统一操控;2)通过Coze网关实现手机/网页端远程连接本地Codex和Claude Code;3)利用Claude Code进行项目最终审核。作者强调人机协作的重要性,虽然不懂编程和英语,但通过工具组合实现了高效工作流,鼓励读者勇敢尝试新技术。文末附开源教程链接和知识库地址。

2026-06-02 13:20:26 537

原创 【无标题】

粗看我这周 GitHub,Meta_Kim 最近一轮大概 47 次提交,Kim_Decision 大概 18 次提交,AI Coding 教程也已经从 Claude Code、OpenClaw,更新完了还新增了 Codex,Codex 部分现在已经按 14 篇结构重整了一轮。我现在更在意的是:一个普通人到底怎么和 AI 协作,怎么拆问题,怎么判断结果,怎么知道什么时候该继续,什么时候该停,什么时候该让 AI 干,什么时候必须人来拍板。这两天后台总有说我最近发的东西太思考层面,特别虚,没多少实操的。

2026-06-01 15:14:51 214

原创 Coze 3.0来了!别再自己复制、粘贴搬上下文了!

摘要:Coze 3.0实现多端AI协作新突破 Coze 3.0版本针对当前AI协作痛点进行了全面升级,重点解决了跨平台数据孤岛问题。该版本支持多人多Agent协同工作,允许云端与本地Agent混合组队,并实现项目资产自动沉淀。主要更新包括:专业行业模板(金融/法律/自媒体等)、本地环境授权接入、手机端视频创作联动、Seedance 2.0等高级功能。实测案例显示,在自媒体运营、研发协作、股市分析等场景中,系统能自动协调多个AI分工合作,显著减少人工中转操作。特别是本地文件与云端协作的无缝衔接功能,使产品/研

2026-06-01 14:11:04 475

原创 Claude Code,Codex App,Openclaw,我的开源AI Coding课程大幅更新了!

新增的内容对照了官方 Release Notes 逐条核对:Opus 4.8 模型支持、五级推理控制(新增了 xhigh 和 max)、Agent View、后台 shell 会话、插件市场、MCP 审批流程、企业治理、/goal 命令、/workflows 命令、/reload-skills、disallowed-tools 配置、MessageDisplay hook、auto mode、遥测控制等。想玩 AI 助手的从 OpenClaw 线开始,OC-01到OC-03,5分钟跑起来第一个对话。

2026-05-31 15:53:50 260

原创 小白速通 Codex App:带录播回放

我重点讲 Codex App,不是因为它永远最强。它适合小白,是因为它把 AI 编程这件事摆到了明面上。你能看到项目。能看到 thread, worktree,diff。能看到浏览器预览。能看到插件、Skill、自动化和 Pets 这些东西怎么挂在一起。它更像是一个私人管家,你说完它就去做,做完为止。但抛弃的是过程,你想看过程就需要来回点一点展开。这就是和Claude Code最大的不同,CC更像是你的搭子,边做边讨论,清晰可见,框架以及跨文件能力要更好一些。

2026-05-29 20:23:27 240

原创 老金装上Caveman后Claude和Codex变穴居人,账单立省75%

《Claude插件caveman:让AI像穴居人一样说话,节省75% token》介绍了一款能大幅降低AI输出token消耗的开源工具。该插件通过改变Claude的输出风格,将技术回答压缩到最短表达,如将69个token的回答精简为19个token而不失准确性。提供4种模式,其中文言文模式尤其适合中文场景。安装简单但需注意Windows兼容性问题。虽然能显著降低token消耗,但在复杂推理场景可能损失细节。该项目49天收获63k GitHub stars,展现了meme文化与实用工具结合的强大传播力。作者认

2026-05-26 18:42:14 416

原创 我把我自己蒸馏成了老金决策.skill并开源了,它甚至教你落地搞钱!

​​老金把自己的决策模型,蒸馏成了一个老金决策.skill,并且开源了。它不只是一个让 AI 学老金说话的提示词。更直接一点说,它甚至能帮你搞钱。你问 AI:我想学 AI 编程,想做个小产品,甚至想靠它挣点钱。它立刻给你一整套方案:课程定位、目标人群、内容体系、社群运营、商业模式。每个词都对,每句话都像那么回事。但你关掉窗口以后,还是卡在那里。今天到底先干什么?找谁?收多少钱?怎么知道这事该继续还是该停?这才是我最想解决的问题。

2026-05-25 14:52:27 368

原创 Claude Code还是Codex?老金告你怎么选!

本文探讨了如何根据任务特性选择AI编程工具(Claude Code vs Codex)。作者指出关键在于区分任务类型:需要实时协作调整的"现场型"任务适合Claude Code,边界清晰的"派单型"任务适合Codex。通过露营报名页案例,提出三步判断法:1)是否需要观察过程;2)任务边界是否清晰;3)能否有效验收结果。文章强调避免"许愿型"模糊需求,建议将愿望转化为明确任务说明,并区分四种用户类型(许愿型、现场型、派单型、调度型),最终应根据任务特性而非工具性能来选择使用方式。

2026-05-21 20:50:27 324

原创 重度抑郁和焦虑那年,是AI的正反馈逐步把我拉回到桌前

作者分享了自己在重度抑郁和焦虑状态下,如何通过系统化使用AI工具重新找回行动力的经历。文章描述了抑郁带来的"空"感与工作压力之间的矛盾,以及AI如何通过提供即时反馈帮助作者打破创作瓶颈。作者强调AI不是替代专业治疗,但确实成为了重要的外部反馈系统,帮助他将模糊想法转化为可修改的草稿。这段经历最终促使作者重新创业,开发专注于任务拆解和协作的AI工具。文章核心观点是:在困境中,微小的正向反馈往往比宏大鼓励更能激发行动勇气。

2026-05-19 18:01:06 391

原创 Claude Code 的 Agent View,让我看到 AI 编程真正麻烦的地方

这篇文章介绍了Claude Code最新推出的Agent View功能,探讨了AI编程工具从单一对话模式向多任务协作模式的演进。文章指出,随着AI能同时处理多个编码任务(如修复bug、测试、重构等),如何有效监控和管理这些并行任务成为新挑战。Agent View通过任务看板的形式,让开发者能够清晰掌握各任务状态,在关键节点进行干预,实现了从"一问一答"到"任务调度"的工作方式转变。作者认为这代表了AI协作的新方向:将复杂工作拆分为可管理的单元,由人类负责目标制定和关键决策,AI负责具体执行。文章还延伸到企业

2026-05-15 17:12:16 233

原创 OpenAI和Anthropic都下场搞一件事儿了,我也准备出来搞事情了!

今天接 OpenAI,明天接 Claude,后天接 Gemini,国内还有 Qwen、DeepSeek、豆包、Kimi。有企业 AI 改造预算的人,有行业客户资源的人,有 SaaS、CRM、ERP、知识库、客服系统、内容系统资源的人。有交付团队、咨询团队、培训团队的人,也包括正在公司内部推动 AI,但卡在流程、数据、权限、员工使用上的人。销售线索流转、内容生产、客服质检、企业培训、知识库、合同审查、产品需求管理、流程自动化,都有机会。

2026-05-14 18:44:35 196

原创 Claude和GPT全用了,AI用起来为啥还是不好用?老金来告你!

先说一个可能不太舒服的结论。AI用得好不好,跟工具几乎没关系。老金我在一开始认为模型越好就行了。换了Claude、GPT、Gemini轮着试。结果发现不对——同样的工具,不同人用出来的效果完全不同。你可以做一个实验。找两个同事,一个干过三年产品,一个刚入行。让他们用同一个AI,写一份竞品分析报告。资深的人出来的东西,方向对,框架稳。该查哪些数据口径心里有数。稍微调调就能用。初级的人出来的东西,结构漂亮,措辞专业。但你一细看。。。

2026-05-13 19:31:08 356

原创 前OpenAI CTO憋了一年,我看到AI从聊天框里爬出来

【摘要】前OpenAI CTO创立的Thinking Machines Lab发布交互模型TML-Interaction-Small,标志着AI交互范式的重要转变。该276B参数的MoE模型采用200毫秒微回合处理机制,能实时接收多模态输入并持续响应,突破传统"一问一答"模式。其创新在于将AI嵌入人类工作流程,捕捉创作停顿、删改等隐性信息,而非仅处理明确指令。与面壁智能的端侧小模型形成技术对比,共同指向下一代AI发展方向:从追求正确答案转向理解工作现场。这种深度协作模式也带来隐私与边界的

2026-05-13 19:13:44 388

原创 3个月12万星,一个文件凭什么让全球开发者买单?

本文介绍了两个开源项目在AI编程领域的创新实践。作者首先更新了自己的AI编程开源课程《ai-coding-guide-zh》,新增OpenAI Codex内容,该课程已获3705星。重点分析了GitHub热门项目andrej-karpathy-skills(12万星),该项目通过一个CLAUDE.md文件定义了AI编程的四大原则:先想再写、简单至上、精准修改和目标驱动,有效解决了AI编程中的常见问题。作者进一步介绍了自己的META_KIM项目,提出从制定规则到构建可进化Agent系统的进阶思路,强调定义AI

2026-05-09 12:56:16 405

原创 ChatGPT免费版数学暴涨24%,还藏了个语音大招

OpenAI近日密集发布两款重磅AI产品:5月5日推出文本模型GPT-5.5 Instant,5月7日发布语音模型GPT-Realtime-2。最引人注目的是,GPT-5.5 Instant直接向免费用户开放旗舰级智力,数学能力提升24%,幻觉率降低52.5%,回答更简洁精准。同时发布的GPT-Realtime-2首次在语音模型中引入GPT-5级推理能力,可处理复杂多轮对话。OpenAI通过将高端能力免费化抢占用户市场,同时在文本和语音两条赛道发力,展现其产品布局的战略意图。虽然跑分亮眼,但实际应用中仍需注

2026-05-08 13:30:40 450

原创 豆包收费68到500,Codex收入7天翻倍,免费AI到头了

【摘要】作者发现个人AI订阅费用已超2000元/月,观察到行业正从免费转向付费的关键转折点。OpenAI的Codex收入7天翻倍,显示企业端开始大规模付费;国内豆包结束两年免费期推出会员制。分析指出AI与搜索引擎不同,高昂的算力成本决定其难以长期免费。建议用户理性评估工具价值:企业可按人力成本换算,个人需衡量时间节省效益。文章揭示AI行业正进入"免费受限+付费增值"的新阶段,提醒用户聚焦真正提升效率的核心工具。(149字)

2026-05-07 13:02:26 314

原创 别问谁更强,GPT-5.5和Opus4.7综合对比

文章摘要:GPT-5.5与Claude Opus 4.7各有优势,关键在于任务类型。GPT-5.5擅长短循环任务(查资料、修bug、跑命令),减少工具切换;Opus 4.7适合长交付任务(重构、代码审查、复杂Agent),减少进度监控。建议组合使用:日常开发用GPT-5.5,复杂任务用Opus 4.7,重要代码交叉验证。价格需综合成功率评估,而非单纯token成本。AI工具选择应关注实际工作流优化,而非盲目追求"最强模型"。

2026-04-27 12:49:54 404

原创 编程媲美闭源顶级模型!DeepSeek V4来了,价格便宜75倍!

DeepSeek-V4预览版悄然上线,带来多项突破性进展:1. 上下文长度从128K跃升至100万Token;2. 采用创新的Engram架构,在百万Token长度下信息召回率达97%;3. 编程能力测试SWE-bench成绩达80.6%,媲美顶级闭源模型;4. 宣布转向华为昇腾芯片,性能提升35倍;5. API定价仅0.2美元/百万Token,仅为竞品的1/12到1/75。该模型采用Apache 2.0协议开源,支持国产芯片生态发展,在价格、性能和开源策略上形成独特优势,可能对AI行业格局产生深远影响。

2026-04-24 13:01:01 416

原创 Claude Code思考深度降67%,老金找到个深度数据说明案例,还有怎么破

Claude Code性能骤降引发社区争议:数据显示其思考深度在两个月内暴跌67%,代码修改前阅读次数减少70%,用户打断率激增12倍。官方承认自适应思考机制存在问题,提供临时解决方案但效果有限。成本飙升122倍的同时产出质量下降,导致用户大量流失至竞品。本文完整披露数据细节、官方回应及应对方案,建议重度用户立即采取补救措施,同时关注替代工具发展。这一事件可能重塑AI编程工具市场格局。

2026-04-09 20:56:51 460

原创 GLM-5.1开源,SWE-Bench Pro 登顶王座,老金帮你拆清楚

中国AI大模型GLM-5.1在SWE-Bench Pro测试中以58.4分超越Opus 4.6,首次登顶全球开源模型榜首。该模型采用754B参数的MoE架构,支持200K上下文窗口和8小时连续自治任务,在编程专项能力上表现突出。虽然价格较前代上涨10%,但性价比仍优于Claude Sonnet 4.6。尽管在综合能力上仍略逊于Opus 4.6,但其快速迭代和开源特性使其成为开发者新选择。

2026-04-09 12:49:33 706

原创 Claude Code被扒出7个缓存Bug,死亡螺旋让账单暴涨10倍

这篇文章揭示了Claude Code存在的7个缓存Bug导致API费用暴涨的问题。核心内容包括: 问题发现:源码泄露暴露了缓存机制缺陷,7个Bug会互相叠加形成"死亡螺旋",使缓存命中率从97%暴跌至4-17% 主要Bug: 哨兵替换和计费关键词导致缓存失效 Resume参数绕过缓存 Extra Usage模式将缓存时间缩短至5分钟 MCP服务器和插件状态变化引发缓存碎片化 影响:用户报告账单激增10倍,简单请求消耗异常配额 解决方案: 减少使用resume参数 控制MCP服务器数量 谨

2026-04-08 12:28:53 645

原创 老金开源“元”概念落地项目雏形,一套让你能做任意你想做的项目的架构!

老金推出Meta_Kim项目,提出"元"概念解决AI编程的治理问题。该项目通过四个关键环节(元、组织镜像、节奏编排、意图放大)和八阶段流程,为复杂AI编程任务建立治理框架。核心是meta-warden代理和meta-theory技能,确保任务边界清晰、职责明确、可审查。项目采用MIT开源协议,已在GitHub发布beta版,支持跨多个运行时使用,旨在将高成本的临时推理转化为可复用的能力资产,实现越用越轻的效果。

2026-04-07 13:00:14 401

原创 元:最小可治理单元。时代的分水岭,是解决复杂问题的能力!

AI行业正从单纯优化回答质量转向构建复杂任务处理系统,核心在于将任务拆解为"元"(最小可治理单元)。合格的元需满足独立、粒度适中、边界清晰、可替换和可复用五大标准。系统架构应包含执行元、编排元和基础设施元三层,并借鉴人类组织经验建立"组织镜像"管理机制。以Claude Code为例,展示了多个元如何通过"发牌机制"协同完成编程任务。这套方法论能有效解决AI写作串味、多智能体系统崩塌等实际问题,为复杂AI系统设计提供了可落地的结构化思路。

2026-04-01 19:19:48 400

原创 OpenAI官方插件进Claude Code,老金装了后工作流省了这4步

OpenAI与Anthropic打破竞争壁垒,推出Codex-Claude联动插件。该插件允许用户在Claude Code工作流中直接调用OpenAI的Codex模型,实现Claude负责需求规划、Codex专注代码生成的高效协作。安装配置简单,可显著提升代码生成速度和质量,降低Token消耗。但高度定制化或复杂业务逻辑场景仍建议单独使用Claude。这一合作标志着AI工具从竞争走向生态融合,用户需根据实际需求合理搭配工具组合。重度代码用户推荐安装,可获20%左右的效率提升。

2026-03-31 13:01:06 678

原创 9个月彻底反转:数据证明,古法编程的人越来越少了

写到这里,老金我忽然意识到一件事。这篇blog可能在AI编程发展史上会被标记为一个转折点。不是因为它说了什么新技术。而是因为它第一次用数据证明了:Agent真的开始替代传统工作流了。9个月,从1/2.5到2倍。这个曲线陡峭得让人有点不安。但也让人兴奋。因为这意味着,我们正在亲眼见证一个行业范式的转变。从人写代码,AI辅助,到人描述需求,AI写代码。这个转变不是在未来。它正在发生。飞书****开源知识库(实时更新交流群**):**

2026-03-27 14:33:20 422

原创 我的Claude Code和小龙虾的全中文开源教程,被人卖8块8了,不知道该哭还是该笑

本文讲述作者发现自己的开源教程被人打包售卖的经历。对方不仅将教程美化整理成PDF,还保留了作者"老金"的署名,却不知这是MIT开源协议的要求。作者对此感到哭笑不得,但更焦虑于对方可能售卖的是存在bug的早期版本。文章详细介绍了教程从v1.0到v3.1的迭代过程,强调最新版已修复诸多问题。作者呼吁读者不要购买盗版,而是通过GitHub或飞书知识库获取免费最新版本,并希望大家能给予star支持。最后表达了坚持开源创作的决心,认为能被盗版也是一种认可。

2026-03-26 13:57:03 502

原创 MiniMax套餐大升级,全球首个全模态订阅来了!

先说结论:MiniMax昨天把Coding Plan升级成了 Token Plan。不只是改个名字,是真的把编程、生图、语音、视频全塞进一个订阅里了。29元起步,一个API Key调全模态。全模态就是文字、图片、语音、视频全都支持。不过29元Starter档只有编程和图像理解,真正"文图音视"通吃要119元Max档。这在国内AI订阅市场里,还是头一回。​​老金我花了大半天研究官方文档和社区讨论。核心变化、值不值得买、要注意的坑,帮你全拆解清楚。先说变了什么,再说值不值。

2026-03-25 13:11:47 5342

原创 微信ClawBot插件支持个人微信,14亿人的AI入口打开了!附带Win踩坑解决方案!

今天刷IT之家,看到一条消息直接坐起来了。微信插件页面,悄悄上了一个新东西。名字叫 ClawBot。功能只有一句话:连接OpenClaw与微信。​这意味着什么?意味着那只GitHub上32万星的"小龙虾",终于有了微信官方认证的入口。不是第三方魔改,不是企业微信绕路,是微信自己做的插件。老金我第一时间装了,给你们说说到底怎么回事。

2026-03-22 15:46:56 4039 2

原创 龙虾装了几百Skill搜不到还冲突?Claude Code官方新版 Skill Creator一键优化!

新版Skill Creator解决了AI技能管理的两大痛点:技能有效性评估和触发词冲突问题。通过自动化测试机制,它能对比安装技能前后的输出差异,生成量化报告,帮助用户识别真正有效的技能。同时采用训练集/测试集分离的优化方法,显著提升技能触发准确率。该工具支持跨平台使用,但存在热重载差异等限制,建议用户通过数据驱动方式优化技能库管理。

2026-03-16 17:23:42 795

原创 Claude 1M正式上线,价格一分不涨,搭了半年RAG的人崩了。。。

你让AI帮你分析一份长合同。AI告诉你:太长了,装不下,你分几次喂吧。你让AI帮你审一整个代码项目。AI告诉你:只能看一部分,你挑重要的给我。你想让AI同时参考你的需求文档、竞品报告、会议纪要。AI告诉你:一次放不下这么多,分四次聊吧。这些问题的根源都一样。AI一次能"看"的信息量有个上限,行话叫 上下文窗口。以前Claude的上限是200K Token。Token是AI的计费单位,大约1.5个Token≈1个中文字,200K大约能装15万中文字。

2026-03-14 23:04:55 587

原创 港大神器,让AI一条命令操控桌面软件!

港大开源项目CLI-Anything通过7阶段流水线自动将GUI软件转化为命令行工具,解决AI操控软件的痛点。该项目能自动分析软件源代码,生成带JSON输出的CLI工具,支持11款主流开源软件,通过1500+测试验证。相比传统GUI自动化方案,CLI方式不依赖界面元素,直接调用底层功能,更稳定可靠。虽然目前仅支持开源软件且需本地安装,但该项目代表了AI操控软件从GUI向CLI转变的新方向,GitHub星标数快速突破9500+,展现了强大潜力。

2026-03-13 18:21:43 440

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除