薛定猫AI-CSDN博客

原创 Codex 与 Claude Code 全平台安装配置指南（Windows / macOS / Linux）

本文整合 **Codex** 与 **Claude Code** 两款主流 AI 编程助手的安装与配置流程，覆盖 Windows、macOS、Linux 三大系统，所有命令均经过验证，可直接复制使用。

2026-05-19 22:48:46 3638

原创【AI教学】windows下一键配置使用claude code（脚本一键配置）

摘要：Claude Code终端AI编程工具一键配置指南 Claude Code是由Anthropic推出的革命性终端AI编程工具，可直接通过自然语言指令完成编码、调试等任务。本文提供Windows平台一键配置方案：特性亮点：终端直接操作，告别复制粘贴超大上下文理解完整项目支持Windows平台配置步骤：下载提供的批处理脚本以管理员身份运行输入薛定猫AI官网获取的API密钥自动完成Node.js环境检测和Claude Code安装，让你一键使用claudecode

2025-11-22 16:44:27 1670

原创【深度解析】Claude Sonnet 5模型评测：从Agent能力、Token成本到Python选型实战

本文基于Claude Sonnet 5相关评测素材，拆解其推理、工具调用、编码与Token成本表现，并通过Python示例演示如何调用高阶大模型完成模型评估任务，帮助开发者建立更稳健的大模型选型方法。

2026-07-01 23:57:25 111

原创【技术干货】Python构建大模型代码能力评测器：从Sonnet类模型测评到API实战落地

本文基于新一代大模型代码生成、推理、工具调用表现的测评素材，拆解模型选型、成本评估与代码能力验证方法，并使用Python调用薛定猫AI完成可运行的大模型评测脚本。

2026-07-01 23:53:20 110

原创【技术干货】Gemini 3 Flash 与 NotebookLM 工作流落地：用 Python 构建可复用 AI 研究助手

本文基于Gemini与NotebookLM的升级功能，探讨如何构建可复用的AI研究助手。文章拆解了提示词复用、资料结构化处理、迭代生成等核心机制，并提供了Python调用大模型API的实战代码（使用Claude-Opus模型）。该助手能自动从多源资料中提取关键信息并生成结构化表格，适用于技术报告、竞品分析等场景。作者建议开发者关注固定系统提示词、结构化输出和迭代优化机制，以提升AI工作流的效率和稳定性，同时强调了数据来源追踪和参数控制的重要性。

2026-06-30 23:15:21 154

原创【深度解析】Long Cat 2.0 MoE架构、长上下文能力与智能体评测实践

本文围绕美团 Long Cat 2.0，解析其 MoE 架构、稀疏注意力、长上下文训练与智能体评测逻辑，并给出基于 Python 的大模型评测脚本，帮助开发者建立可复用的模型能力验证流程。

2026-06-30 23:10:26 185

原创 Codex与 Claude Code安装与配置流程

本文整合与两款主流 AI 编程助手的安装与配置流程，覆盖 Windows、macOS、Linux 三大系统，所有命令均经过验证，可直接复制使用。

2026-06-30 23:09:12 694

原创【深度解析】GPT-5.6 Sol/Tara/Luna能力边界、安全风险与Python选型评估实

本文围绕GPT-5.6 Sol、Tara、Luna的能力差异、安全边界、成本结构与模型选型展开分析，并提供Python脚本实现大模型API调用与响应质量评估，帮助开发者建立可落地的模型评估流程。

2026-06-29 23:55:02 194

原创【技术干货】GPT 5.5智能体能力拆解：用Python构建大模型任务评测工作流

本文基于GPT 5.5发布信息，拆解智能体规划、长上下文、幻觉控制与安全约束等核心能力，并用Python实现一个可运行的大模型任务评测脚本，帮助开发者从真实任务角度判断模型可用性。

2026-06-28 23:42:05 219

原创【深度解析】多智能体编排系统原理：从 Fugu Ultra 看大模型协同推理与工程落地

本文基于 Fugu Ultra 的公开演示与评测现象，拆解多智能体编排系统的任务分解、模型路由、结果验证与聚合机制，并用 Python 实现一个可运行的编排式大模型调用流程，帮助开发者理解其优势、成本与适用边界。

2026-06-28 23:20:33 179

原创【技术干货】AI资讯自动结构化分析实战：基于Claude Opus 4.8构建大模型情报摘要工具

本文围绕AI行业资讯高频更新、信息碎片化问题，拆解如何使用Python调用大模型API，对视频字幕类素材进行结构化摘要、风险识别与技术趋势提取，帮助开发者快速构建AI情报分析工具。

2026-06-27 23:05:48 223

原创【技术干货】Orneth 编程模型实战解析：本地编码代理、工具调用与工作流优化

本文围绕 Orneth 编程模型的核心能力展开，拆解其“脚手架式”推理与工具调用机制，并结合 Python 实战演示如何通过薛定猫AI接入 `claude-opus-4-8` 完成代码生成、文件检查与结果输出，帮助开发者快速搭建可落地的 AI 编程助手。

2026-06-27 22:55:55 228

原创【技术干货】AI视频生成提示词实战：角色一致性、时间轴Prompt与Python自动优化流程

本文围绕AI视频生成中的角色漂移、动作失控、音画不同步问题，拆解图生视频、角色画板、时间轴提示词等核心方法，并用Python调用 Claude Opus 4.8 自动生成可复用视频Prompt。

2026-06-26 23:52:41 345

原创【技术干货】Hermes Regent /learn 技能生成实战：用大模型自动沉淀终端智能体工作流

本文围绕 Hermes Regent 的 `/learn` 能力，拆解 AI 终端智能体如何从 URL、目录与对话中自动提炼工作流，并生成可复用 Skill。文章包含原理解析、Python 调用大模型示例、平台选型与避坑建议，帮助开发者构建可复用的 AI 自动化开发流程。

2026-06-26 23:48:04 181

原创【技术干货】Gemini Gems工作流拆解：用Python实现可复用AI专家助手

本文基于 Gemini Gems 的核心机制，拆解“持久化指令 + 私有知识上下文”的工程价值，并用 Python 实现一个可复用 AI 专家助手，帮助开发者减少重复提示词配置，提升大模型日常开发效率。

2026-06-25 22:16:23 213

原创【技术干货】长程代码智能体实战：基于大模型 API 构建代码库架构分析助手

本文围绕 Kimi 2.7 Code 所代表的长程代码智能体能力，拆解其长上下文、多文件理解、工具调用与任务规划机制，并使用 Python 调用大模型 API 实现一个可运行的代码库架构分析助手。

2026-06-25 21:55:55 184

原创【深度解析】Vibe-Thinker 3B小参数推理模型：CLR测试时扩展与数学推理实战

本文解析Vibe-Thinker 3B为何能在数学推理任务中接近前沿大模型，重点拆解参数压缩覆盖假设、CLR测试时扩展机制，并用Python实现多候选答案生成与可靠性筛选流程。

2026-06-24 23:35:12 234

原创【技术干货】Claude 4.8 + Vibe Directing：用大模型生成微短剧分集剧本与镜头脚本实战

本文拆解 Vibe Directing 在 AI 微短剧创作中的落地流程，围绕角色设定、分集结构、悬念设计、镜头脚本生成与人工校订展开，并提供基于 Python 调用 claude-opus-4-8 的可运行代码，帮助开发者快速构建 AI 辅助短剧创作工作流。

2026-06-24 00:11:38 184

原创【深度解析】多智能体模型路由架构：从 Sakana Fugu 看大模型编排系统的工程落地

本文基于 Sakana Fugu 的产品形态与测试表现，拆解“模型路由器/多智能体编排”区别于单一基础模型的核心逻辑，并用 Python 实现一个可运行的大模型 API 调用示例，帮助开发者理解模型选型、编排适用场景与工程落地注意事项。

2026-06-23 22:30:59 203

原创 Claude Code 完整配置指南：Windows 用户零门槛上手终端 AI 编程

当 Claude Code 刚发布时，很多人觉得它不过是又一个 AI 编程工具。但随着深入使用，我越来越意识到它的定位与传统 IDE 插件完全不同——它更像是一位被请到本地的、具备动手能力的资深工程师。本文不仅提供完整配置方案，还会深入解析为什么这款工具值得你投入时间学习。在目录下创建模板文件，封装常用的复杂指令。例如创建review.md可以一键触发代码审查流程。Claude Code 正在重新定义开发者与 AI 的协作方式。它的价值不仅在于提升单次任务的效率，更在于改变了人机协作的交互范式。

2026-06-22 23:44:50 1687

原创【技术干货】GLM 5.2 + Open Design 构建可导出的 AI UI 原型工作流

本文拆解 GLM 5.2 与 Open Design 的 AI UI 生成流程，覆盖提示词设计、原型生成、导出集成与 Python API 调用实践，帮助开发者构建可落地的网页、仪表盘和移动端界面原型。

2026-06-22 23:39:13 355

原创【深度解析】GPT-5.6推理预算升级与复杂Agent代码生成实战

本文基于GPT-5.6相关测试信息，拆解推理预算、工具集成、Agent工作流与代码生成能力演进，并通过Python调用大模型API完成复杂任务拆解示例，帮助开发者理解新一代模型在自动化研发场景中的落地方式。

2026-06-21 23:45:26 235

原创【技术干货】Gemma 4 12B Agentic本地编码模型评测与Python实战调用方案

本文围绕 Gemma 4 12B Agentic 微调模型，拆解其本地编码、工具调用、多步推理能力，并通过 Python 调用 claude-opus-4-8 构建可复用评测脚本，帮助开发者判断本地 Agent 模型是否适合真实编码工作流。

2026-06-21 23:14:52 261

原创【深度解析】GLM 5.2开源大模型能力拆解：长上下文、前端生成与Python评测实战

本文基于GLM 5.2发布信息，拆解其百万Token上下文、编码代理、前端生成与3D场景生成能力，并通过Python调用大模型API构建评测脚本，帮助开发者掌握开源模型选型与实战验证方法。

2026-06-20 23:36:35 247

原创【技术干货】AI应用构建器实战：用大模型规划并生成创作者赞助管理后台

本文围绕 AI 应用构建器工作流，拆解如何用大模型完成需求规划、代码生成、数据持久化与迭代优化，并通过 Python 调用薛定猫AI的 claude-opus-4-8 模型，演示创作者赞助管理后台的需求拆解与原型生成能力。

2026-06-20 23:18:07 214

原创【深度解析】企业级AI Agent工作流：从Copilot Cowork到多模型任务编排实战

本文围绕Copilot Cowork、DeepSeek接入、多模型Agent和Web IQ检索增强展开，拆解企业级AI Agent的任务分解、工具调用、上下文检索、成本计量与安全治理，并提供Python可运行示例，帮助开发者构建可控的长任务智能体原型。

2026-06-19 22:25:39 219

原创【深度解析】Ego Light智能体浏览器：真实登录态下的AI浏览器自动化实战

浏览器Agent在演示场景中通常表现稳定：打开页面、点击按钮、读取文本、生成结果。但一旦进入真实业务网站，问题会迅速暴露。登录态失效、双因素认证中断流程、标签页失控、空白浏览器配置缺少Cookie、页面状态无法复用，都会让原本简单的任务变成高成本的“点击、等待、截图、再判断”循环。真实业务中的自动化验证并不只发生在API层。CRM、LinkedIn、Gmail、Notion、后台管理系统、测试环境Dashboard等核心流程，往往依赖复杂Web界面。

2026-06-19 21:34:57 254

原创【技术干货】NotebookLM式智能研究助手：用Python实现多源资料分析、结构化报告与来源归因

本文拆解 NotebookLM 从文档问答升级为智能研究助手的核心逻辑，并基于 Python 与大模型 API 实现多源资料汇总、研究问题拆解、结构化报告生成和来源归因，帮助开发者快速搭建可落地的 AI 研究工作流。

2026-06-18 22:30:16 340

原创【深度解析】GLM 5.2与Z-Code代码智能体：长上下文工程任务原理与Python实战

本文拆解GLM 5.2与Z-Code代码智能体的核心机制、工程适配场景和实战调用方式，帮助开发者理解长上下文、多工具协同与代码生成落地流程。

2026-06-18 21:26:53 239

原创【技术干货】MiniMax Agent 工作空间拆解：用 Python 构建大模型多步骤任务规划 Demo

本文围绕 MiniMax M3 与 Agent 工作空间思路，拆解 AI 原生工作流的核心机制，并通过 Python 调用大模型 API 实现“项目任务拆解与交付物规划”示例，帮助开发者理解多模态 Agent 在编码、文档、自动化场景中的落地方式。

2026-06-17 22:54:51 449

原创【技术干货】MiniMax M3多模态Agent工作空间实战：一站式AI开发新范式

本文深度解析MiniMax M3模型及其Agent工作空间架构，涵盖百万级Token上下文、多模态能力整合、桌面端协同开发等核心技术要点，结合Python实战代码演示统一API调用流程，助力开发者构建高效AI原生工作流，降低多工具切换成本。

2026-06-17 22:44:48 265

原创【技术干货】OpenRouter Fusion复合API实战：多模型协同调用如何突破单模型性能瓶颈

本文深度解析OpenRouter推出的Fusion复合API技术方案，剖析其多模型并行调用、答案融合机制的底层逻辑，结合实战代码演示如何以一半成本逼近顶级模型性能，并梳理深度研究场景下的适配要点与技术选型策略，为开发者提供多模型协同开发的完整落地方案。

2026-06-16 22:15:10 281

原创【深度分析】Claude是下一个AGI吗？——冷静审视“Mythic级“模型与Claude 6的现实预期

随着Claude等大语言模型达到新的性能天花板，AGI辩论愈演愈烈。本文剥去炒作的外衣，深入分析"mythic级"模型真正实现了什么、通用智能的硬边界在哪里，以及Claude 6实际上可以期待带来什么——立足于工程现实，而非营销叙事。

2026-06-16 21:51:07 211

原创【深度解析】OpenRouter Fusion 复合API技术拆解：多模型融合架构原理与实战评估

本文深入拆解 OpenRouter 推出的 Fusion 复合 API 技术原理，解析其"多模型并行 + 裁判合成"的核心架构，结合 DRAACO 基准测试数据还原真实性能表现，同时通过代码实战演示接入方式，帮助开发者判断 Fusion 在深度研究、智能体、代码生成等场景中的适配性与局限。

2026-06-15 22:35:57 297

原创【技术干货】NVIDIA NIM免费API接入实战：MiniMax M3/Step-3.7-Flash/NemeTron 3 Ultra三模型AI编程工作流搭建

本文聚焦NVIDIA NIM（Inference Microservices）免费API生态，深度拆解MiniMax M3、Step-3.7-Flash、NemeTron 3 Ultra三款前沿模型的核心能力与差异定位，提供完整的Python接入代码与多场景AI编程工作流配置方案，助你零成本搭建高质量AI辅助开发环境。

2026-06-15 21:43:30 335

原创 Claude Code 一键配置教程：Windows 用户也能优雅地使用 AI 编程神器

本文详细介绍 Anthropic 推出的终端 AI 编程工具 Claude Code，并提供一键配置脚本，让 Windows 用户也能零门槛体验这款革命性的开发效率工具。

2026-06-15 21:42:39 1756

原创【技术干货】Kimi K2.7 Code 深度拆解：MCP工具调用超越Claude，开源编程模型新标杆

Moonshot AI 于6月12日发布 Kimi K2.7 Code，1万亿总参数MoE架构，每token仅激活320亿参数，推理token用量较K2.6减少30%。MCP Mark Verified基准测试得分81.1，首次超越Claude Opus 4.8，成为Agent自动化开发的强力候选。本文拆解其架构原理、核心优势及完整API调用实战。

2026-06-14 23:07:21 543

原创【深度解析】OpenRouter Fusion API 技术拆解：多模型融合架构的能力边界与工程实践

OpenRouter 推出的 Fusion API 以"多模型并行 + 裁判聚合"为核心架构，声称以半价达到 Fable 级别智能。本文从技术原理、架构设计、工程实践三个维度深入拆解 Fusion API 的运作机制，结合实测表现客观分析其适用边界，帮助开发者在实际项目中做出理性的模型选型决策。

2026-06-14 22:45:52 715

原创【技术干货】MiniMax M3开源大模型实战：多模态推理+智能体工作流全解析

MiniMax M3是近期最受关注的开源大模型之一，支持百万级token上下文、原生多模态处理，性能对标顶级闭源模型。本文系统拆解M3的核心能力与底层架构，并结合Python实战代码演示多模态API调用与智能体工作流搭建，帮助开发者快速落地高性价比AI应用。

2026-06-13 22:41:59 219

原创【技术干货】GLM 5.2 实战评测：百万Token上下文窗口+代码生成全面解析

本文基于 GLM 5.2 模型实测数据，深入解析其百万 Token 上下文窗口、代码生成能力、3D 建模任务及模型微调等核心特性，结合 Python 实战代码演示 API 接入全流程，帮助开发者快速评估该模型在真实开发场景中的应用价值与选型参考。

2026-06-13 22:18:59 366

空空如也

空空如也