人工小情绪-CSDN博客

原创 Windows 安装 Codex 桌面版，并用 CC Switch 管理配置

安装Codex 后用 ChatGPT 账号登录，选择项目文件夹，就可以开始让 Codex 在本机协助开发。CC Switch 则适合进阶配置：当你需要切换 API Provider、管理模型、同步 MCP/Skills/Prompts 或维护多套配置时，用它比手动编辑下的配置文件更稳、更直观。

2026-06-09 21:40:44 1621 2

原创 Antigravity 2.0 更新：它不只是一个 AI IDE 了

Google 在 I/O 2026 发布 Antigravity 2.0，把它从 AI IDE 推向多智能体工作台。本文介绍核心更新、桌面版和 CLI 的上手方法，以及实际使用时该注意的权限和边界。tags: Antigravity, AI IDE, 开发工具, AI AgentAntigravity 更新到了2.0 版本，但这次更新有点容易让人困惑。因为 Antigravity 2.0 不是简单地把原来的 AI IDE 换个皮，也不是多塞几个按钮。

2026-06-09 21:37:54 590

原创昇腾（Ascend）系列产品和常用命令介绍

在昇腾硬件之上，华为提供了异构计算架构，它是连接上层AI框架与底层昇腾硬件的桥梁。对上支持多种AI框架，对下服务AI处理器与编程，发挥承上启下的关键作用，是提升昇腾AI处理器计算效率的关键平台。昇腾AI软件栈驱动：提供硬件访问能力。昇腾AI处理器运行时（AscendCL）：提供运行时API，用于资源管理、任务调度等。昇腾AI任务调度器：负责任务在CPU和NPU（Neural-network Processing Unit）之间的调度。

2026-05-18 09:48:55 605

原创 AI Agent工作流程简介

过去两年，大模型（LLM）快速发展，很多人已经习惯了使用ChatGPT、Claude、Gemini或者DeepSeek等大模型。这些模型很好用，但是它们一般只会聊天，并不能真正帮我们做事。于是，AI 行业开始从“LLM（大模型）”进入下一个阶段，即AI Agent（智能体）。

2026-05-18 09:47:09 393

原创 CLIP (Contrastive Language-Image Pre-training) 论文解读

CLIP 是多模态和通用人工智能（AGI）领域的里程碑式工作。自然语言是一种极其强大的监督信号。它比离散的数字或类别标签（如 0, 1, 2）蕴含着更丰富、更密集的语义信息，能够极大地提升视觉模型的表征能力。多模态对比学习 + 大规模数据 = 强泛化能力。这种范式颠覆了传统的计算机视觉训练模式，开启了“视觉基础大模型”的时代。催生了新一代生成式 AI：CLIP 不仅本身具备强大的检索和分类能力，它还成为了后续众多突破性文生图（Text-to-Image）模型（如DALL-E 2Midjourney。

2026-05-06 09:46:17 563

原创大模型原理：理解生成式模型和语言模型

以前的人工智能，更多说的是“判别式模型”。比如上传一张照片给模型，它会判断“这是一只猫”还是“这是一只狗”。这种模型叫“判别式模型”，它关心的是分类的结果。而生成式模型，顾名思义，他做的事情是“凭空造出什么”。它通过学习海量的数据，掌握了这些数据背后的潜在规律。模型学成之后，它可以根据这些规律，从零开始生成一张新的图片，这张图片在现实中并不存在，但看起来却非常真实。不管是生成全新的文字、图片、还是视频和音乐，只要是“无中生有”的新东西，利用的都是生成式模型。圈内代表作有什么？GAN（生成对抗网络）

2026-05-06 09:44:51 386

原创 GPT3论文深度解读

Tom B. Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah 等 (OpenAI, 2020)在 GPT-2 证明了生成式模型具备 Zero-Shot（零样本）潜力的一年后，OpenAI 发布了参数量高达 1750 亿的“庞然大物” GPT-3。。

2026-04-23 10:04:44 419

原创 GPT-1 论文深度解读

优点：通用性强，泛化能力优秀；训练框架简单统一；极大地降低了对大规模高质量特定任务标注数据的依赖。局限性：由于是单向语言模型（仅用左侧上下文预测右侧），在一些需要双向深度语境信息的任务（如阅读理解中的填空）上表现不如稍后推出的双向模型 BERT。但长远来看，单向自回归架构在生成式任务上取得了压倒性优势。

2026-04-23 10:03:54 567

原创 Vision Transformer (ViT) 论文深度解析

ViT (Vision Transformer) 是一个具有里程碑意义的工作。它用一种极其简单、暴力且干净的方式告诉研究者们：如果算力和数据都足够，放弃那些繁杂的人为设计先验结构，拥抱更加通用的 Transformer 架构，是通往更大规模智能的可行方案。

2026-04-13 08:30:00 740

原创 EfficientNetV2 论文深度解读

大图像尺寸导致训练缓慢：V1 常常为了追求高精度而使用非常大的输入分辨率，严重影响了计算和训练效率。深度卷积（Depthwise Convolutions）在早期的网络层速度慢：深度卷积虽然参数量少，但在硬件上的底层算子优化往往不及普通卷积高效。等比例的扩展策略并不是最优的：无论深度、宽度还是分辨率，每一层不一定都需要按照同样的比例进行扩展。追求更高的效率（Faster Training）和更小的模型尺寸（Smaller Models）。

2026-04-13 08:30:00 335

原创 Linux下离线安装timm

PyTorchImageModels，简称 timm，是一个巨大的 PyTorch 代码集合。里面包含了很多视觉模型的预训练模型，例如：ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt等。

2026-04-08 20:03:28 237

原创 Antigratity编程实用指南

传统 AI 往往是问答模式，通过向AI发送指令，指导AI输出代码。Antigravity 引入了Agentic Mode（代理模式），使其具备了自主工作的能力。PLANNING (规划)它不会立即写代码，而是先分析你的 codebase。它会生成一个，列出它打算修改哪些文件、如何修改以及如何验证。关键点：这是你介入的最佳时机。如果计划有误，现在纠正比代码写完后改要容易得多。EXECUTION (执行)获得批准后，它开始执行。它会创建文件、修改代码、运行终端命令。它会实时更新task.md。

2026-02-08 17:21:19 949

原创 Agent skills简介

简单来说，就像是为 AI 智能体安装的“扩展包”或“插件”。从技术角度看，Skill 通常是一个包含特定指令、脚本和资源的文件夹。它是对智能体能力的模块化扩展。SKILL.md（核心）：这是技能的“说明书”。它包含 YAML 头部（定义名称、描述）和详细的 Markdown 指令，告诉智能体在什么情况下使用该技能，以及具体的操作步骤。Scripts（脚本）：辅助智能体执行任务的自动化脚本（如 Python 或 Shell 脚本）。Resources（资源）：模板文件、配置文件或参考文档。

2026-02-08 17:20:53 556

原创掌握 Claude Code：从入门到高效开发的实用指南

Claude Code 是一个基于终端的工具，它直接集成在你的开发环境中。与传统的 IDE 插件不同，它更像是一个不知疲倦的结对编程伙伴（Pair Programmer）。核心优势：深度上下文理解：它能扫描和索引你的本地文件，理解项目结构。终端集成：可以直接运行测试、git 命令、文件操作等。Agentic 工作流：能够规划任务步骤，而不仅仅是回答问题。Claude Code 是一个能极大提升生产力的工具，前提是你把它当作一个优秀的初级/中级工程师。

2026-02-01 20:34:07 1121

原创 Clawbot (OpenClaw)简介

OpenClaw 是一个“消息优先（Messaging-First）”的 AI 助理, 它是一个可以运行在自己设备上的私人AI助手。它的核心理念是将强大的 AI 能力无缝集成到你日常沟通的工具中。尽管现在有层出不穷的AI助手，但是大多数工具都要求你打开特定的网页或者 App。而OpenClaw 就像你的朋友一样，活在你最常用的聊天软件里（比如：Telegram, Discord, Slack），并且运行在你自己的电脑上，保护你的隐私。

2026-02-01 20:32:07 2348

原创大模型微调 (Fine-Tuning) 指南

预训练 (Pre-training)过程：让模型阅读海量的互联网文本（维基百科、书籍、代码等）。结果：模型学会了语法、逻辑、常识，拥有了广泛的通识知识。类比：这是一个刚刚毕业的大学生，博学多才，但没进公司接受过培训，不懂具体的业务流程。微调 (Fine-tuning)过程：在预训练模型的基础上，使用特定领域的、高质量的小数据集进行进一步训练。结果：模型掌握了特定领域的知识、术语或指令跟随能力。类比：这是对大学生的**“入职培训”**。

2026-01-29 23:15:58 1111

原创 windows 安装claude code 教程

Claude Code 是 Anthropic 推出的 AI 编程助手，可以直接在终端中运行，帮助你理解代码库、编辑文件和执行任务。Claude code 可以安装在Linux / macOS / windows 平台上。本教程将指导你在 Windows 10 系统上安装和配置。

2026-01-29 23:14:44 2317 1

原创图像分割 - DeepLabv3+论文解读

DeepLabv3+ 是 DeepLab 系列的集大成者。它通过引入 Encoder-Decoder 结构解决了 deeplabv3 边缘分割不够精细的问题，并利用深度可分离卷积（Xception）大幅提升了计算效率和性能。至今，它仍是工业界语义分割任务的首选基准模型之一。

2026-01-24 09:05:49 801

原创图像分割 - DeepLabv3 论文深度解读

无需 CRF：DeepLab v3 展示了纯 CNN 架构（配合强大的 ASPP）足以生成精细的分割结果，甚至优于之前带 CRF 的模型。性能：在 PASCAL VOC 2012 基准测试中，DeepLab v3 取得了当时的 State-of-the-art 性能。DeepLabv3 通过精细设计的 ASPP 模块（结合空洞卷积、BN 和全局特征），有效地解决了语义分割中的多尺度和分辨率问题。它的架构简洁高效，不仅去除了复杂的 CRF 后处理，还提供了极佳的分割精度，是语义分割领域的经典之作。

2026-01-24 09:05:13 721

原创图像分割 - PSPNet (Pyramid Scene Parsing Network)论文解读

PSPNet 是一篇非常扎实的工程化论文。它没有极其复杂的数学推导，而是基于对“感受野”和“上下文”的深刻理解，设计了一个优雅的模块。给 AI 从业者的 Takeaway：在做视觉任务时，永远不要忽视全局信息。局部特征决定细节，全局特征决定“它是什么”。金字塔结构（Pyramid）是处理多尺度物体的通用解法，不仅在分割中有效，在检测（如 FPN）中同样适用。论文中对 BatchSize 的调整、数据增强（随机旋转、缩放）以及“Poly”学习率策略的坚持，是其达到 SOTA 的重要保障。

2026-01-18 22:15:13 925

原创 Antigravity简介

Antigravity 旨在解决复杂的编程任务。主动规划：将大任务拆解为小步骤。自主执行：使用终端、文件编辑器和浏览器等工具。自我验证：运行测试并根据结果修复错误。维护状态：通过“Artifacts（产物文档）”跟踪项目进度和上下文。

2026-01-18 22:12:58 1145

原创深度学习模型部署

深度学习模型部署是一个系统工程，需要综合考虑性能、成本、可维护性和扩展性。成功的部署不仅需要技术能力，还需要理解业务需求、硬件限制和运维要求。随着AI应用的普及，部署技术正朝着自动化、标准化和多样化的方向发展，为不同场景提供更加优化的解决方案。

2026-01-11 23:31:25 1347

原创深度学习模型部署形式

部署方式优点缺点核心技术云端 API算力无限、易于维护、多端通用依赖网络、有隐私风险、带宽贵边缘设备响应极快、无需网络、安全硬件成本高、维护困难手机端侧零服务器成本、极致隐私电池损耗、算力有限、模型需压缩大模型私有化数据安全、定制化强显存门槛高、技术要求高。

2026-01-11 23:30:34 1021

原创 docker常用命令

掌握这些 Docker 常用操作后，你将能够更加自如地管理容器化应用。记住，实践是最好的学习方式——多动手操作，遇到问题查阅官方文档，你会很快成为 Docker 使用高手。Docker 的世界还有很多高级功能等待探索，但这些基础操作已经能够覆盖 80% 的日常使用场景。使用命令别名可以大幅提高效率，例如在~/.bashrc。

2026-01-03 22:03:07 1013

原创 python报错：AttributeError: module ‘numpy‘ has no attribute ‘object‘.

在使用python numpy的时候，报错：AttributeError: module ‘numpy’ has no attribute ‘object’.这个错误通常是由于NumPy版本更新导致的，因为 np.object 在较新版本中已被弃用。方法2：直接将代码中的 np.object 替换为 Python 内置的 object：方法3：可以保持向后兼容2. 问题延伸问题描述：File “/usr/local/lib/python3.8/dist-packages/tensor

2026-01-03 22:01:43 1027

原创大模型核心原理-关键技术解析：预训练、SFT、RLHF

预训练（Pre-training）：通过海量数据提炼出蕴含智慧的基座模型。这一步最贵，消耗算力最大。将基座模型进行优化，让它具备对话能力。打磨细节，去除杂质，让它对齐人类价值观。正是这三个步骤的精密配合，才让我们拥有了今天这样强大、智能的 AI 助手。如果你觉得这篇文章对你有帮助，欢迎转发分享！关于大模型技术你还有什么想了解的？在评论区告诉我吧！

2025-12-17 23:40:32 1269 1

原创 GPT进展：从GPT-1到GPT-5

本文主要梳理 GPT（Generative Pre-trained Transformer）家族的发展史。随着数据和技术的更新，GPT模型的能力也越来越强。模型越来越大，数据越来越多，从“续写文字”变成了“理解指令”和“逻辑推理”。模型核心突破你的感觉GPT-1证明了“预训练”这条路走得通“这是啥？好像有点意思但没啥用。GPT-2证明了“模型越大越智能”“哇，它编的故事好逼真！GPT-3拥有了通用能力，不用微调“天哪，它什么都会，就是有点不受控。GPT-3.5学会了听从人类指令 (RLHF)

2025-12-17 23:38:51 1095 1

原创 pytorch nn.CrossEntropyLoss

不要加 Softmax：模型的最后一层直接输出 Linear 层的结果即可，不要画蛇添足。标签要是索引：Target 应该是[0, 2, 1]这样的整数索引，而不是 One-hot 向量。类型要对齐：预测值是 Float，标签值是 Long。希望这篇教程能帮你彻底搞定 PyTorch 中的交叉熵损失函数！如果你在实际操作中遇到了问题，欢迎在评论区留言，我们一起探讨。

2025-12-07 23:17:48 987 1

原创 Labelme安装教程

通过使用 Anaconda 创建一个隔离的虚拟环境，我们为 LabelMe 提供了一个纯净且稳定的运行空间，这是最专业、最可靠的安装方式。希望这篇保姆级教程能帮助你顺利迈出计算机视觉项目的第一步。祝你标注愉快！

2025-12-07 23:15:17 1277

原创 PyTorch 转 ONNX 实用教程

ONNX 是一个用于机器学习模型的开放格式，旨在解决不同框架之间的模型互操作性和跨平台部署问题。它是一个中间表示格式，当你使用一个框架训练模型，但需要在另一个不同的框架中运行它时，可以使用 ONNX 进行转换。或者当你需要将模型部署到不同的硬件设备上时，例如从云端的 GPU 迁移到边缘设备的 CPU 时，ONNX 可以提供一个通用的部署桥梁。

2025-12-03 23:35:39 590

原创大模型原理：Transformer简介

Transformer是一种采用注意力机制（Attention Mechanism）的深度学习架构，它摒弃了RNN的循环结构，可以按输入数据各部分重要性的不同而分配不同的权重。它最初被应用于机器翻译任务，并取得了巨大成功，此后迅速成为NLP领域的标准模型架构。Transformer的核心优势在于其自注意力机制（Self-Attention）。该机制允许模型在处理一个单词时，能够同时关注到输入序列中的所有其他单词，并计算它们之间的相关性权重。这种全局视野使得模型能更有效地捕捉长距离依赖关系。

2025-11-19 13:11:00 869

原创大模型原理：大模型运行的基本机制

例如，“猫”的向量会离“狗”和“宠物”更近，而离“汽车”和“天空”更远。这种向量化的表示方法，使得模型能够在数学层面上理解和推理词与词之间的关系，比如类比关系（“国王” - “男人” + “女人” ≈ “女王”）。在处理第二个“水”时，则会更关注“一杯”这个词。：模型会从这个列表中选择一个词元（通常是概率最高的那个），然后将这个新生成的词元添加到输入序列中，再次作为新的输入来预测再下一个词元。顾名思义，它允许模型在处理一个词元时，能够“关注”到输入序列中的所有其他词元，并为每个词元分配一个“注意力分数”。

2025-11-18 23:36:05 1106

原创让大模型更好用的三种方法：Prompt，外挂知识库和微调

提示词工程、外挂知识库和微调并非相互排斥，在实际应用中，将它们结合使用往往能发挥出最大的威力。例如，可以先对一个模型进行微调，使其适应特定领域的语言风格，然后通过RAG为其接入实时更新的业务数据，最后再通过精心设计的提示词来优化最终的输出质量。理解这三种方法的原理和适用场景，将帮助你更好地驾驭大型语言模型，让这个强大的工具在你的工作和生活中发挥出真正的价值。

2025-11-11 23:36:04 1227

原创 python -m的使用方法

python -m不仅仅是运行 Python 脚本的另一种方式，更是一种遵循 Python 模块和包规范的实践。它通过修改模块搜索路径的机制，优雅地解决了复杂的导入问题，并为我们提供了一种统一、可靠的方式来执行标准库模块和第三方包。下次当你遇到难以捉摸的，或者想要更方便地使用 Python 自带的工具时，不妨试试python -m，它或许能为你打开一扇新的大门。

2025-11-11 23:34:19 810

原创大模型提示工程指南

简单来说，提示工程是设计和优化输入（即“提示”），以引导大语言模型（LLM）等生成式AI产生期望输出的过程。这不仅仅是简单地提问，而是通过精心设计的指令、上下文、甚至是范例，来精准地指导AI的思考路径和回应方式。在一个AI技术日益融入我们生活的时代，掌握提示工程变得至关重要。无论是内容创作、客户服务自动化，还是软件开发和数据分析，高质量的提示都是解锁AI全部潜能的钥匙。一个好的提示，能将一个通用的AI模型，瞬间转变为特定领域的专家。

2025-11-03 23:35:31 667

原创 AIGC与大模型

总而言之，AIGC 和大模型是同一场技术革命的两个侧面。大模型是深藏于内的、强大的技术核心，而 AIGC 则是其绚丽多彩、影响深远的应用外壳。当我们惊叹于 AIGC 带来的无限创意时，我们实际上是在见证大模型这项基础技术所释放的巨大潜能。理解了这层关系，你不仅能更好地使用这些 AI 工具，更能洞察未来科技发展的浪潮之巅。

2025-10-30 23:51:16 898

原创一文读懂模型上下文协议 (MCP)

如果 AI 不仅能“说”，还能“做”，将释放无限潜能，这正是 MCP 要解决的问题。同样，在 MCP 出现之前，让 AI 模型连接到每一个外部工具或数据源，都需要编写定制化的代码，这是一个复杂且碎片化的过程。无论是连接数据库、调用 GitHub API，还是操作本地文件系统，Agent 都无需关心底层实现的差异，只需通过 MCP 发送标准化的请求即可。Agent 是让 AI “动起来”的关键。简而言之，如果说大模型是 AI 的“大脑”，那么 MCP 就是赋予它与物理世界和数字世界交互能力的“手和脚”。

2025-10-29 17:02:01 840

毕业设计课题+学生选课系统+python+Flask

AI智能客服系统+语义匹配+python

python+五子棋小游戏+休闲娱乐

空空如也