- 博客(53)
- 收藏
- 关注
原创 Windows 安装 Codex 桌面版,并用 CC Switch 管理配置
安装Codex 后用 ChatGPT 账号登录,选择项目文件夹,就可以开始让 Codex 在本机协助开发。CC Switch 则适合进阶配置:当你需要切换 API Provider、管理模型、同步 MCP/Skills/Prompts 或维护多套配置时,用它比手动编辑下的配置文件更稳、更直观。
2026-06-09 21:40:44
1621
2
原创 Antigravity 2.0 更新:它不只是一个 AI IDE 了
Google 在 I/O 2026 发布 Antigravity 2.0,把它从 AI IDE 推向多智能体工作台。本文介绍核心更新、桌面版和 CLI 的上手方法,以及实际使用时该注意的权限和边界。tags: Antigravity, AI IDE, 开发工具, AI AgentAntigravity 更新到了2.0 版本,但这次更新有点容易让人困惑。因为 Antigravity 2.0 不是简单地把原来的 AI IDE 换个皮,也不是多塞几个按钮。
2026-06-09 21:37:54
590
原创 昇腾(Ascend)系列产品和常用命令介绍
在昇腾硬件之上,华为提供了异构计算架构,它是连接上层AI框架与底层昇腾硬件的桥梁。对上支持多种AI框架,对下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。昇腾AI软件栈驱动:提供硬件访问能力。昇腾AI处理器运行时(AscendCL):提供运行时API,用于资源管理、任务调度等。昇腾AI任务调度器:负责任务在CPU和NPU(Neural-network Processing Unit)之间的调度。
2026-05-18 09:48:55
605
原创 AI Agent工作流程简介
过去两年,大模型(LLM)快速发展,很多人已经习惯了使用ChatGPT、Claude、Gemini或者DeepSeek等大模型。这些模型很好用,但是它们一般只会聊天,并不能真正帮我们做事。于是,AI 行业开始从“LLM(大模型)”进入下一个阶段,即AI Agent(智能体)。
2026-05-18 09:47:09
393
原创 CLIP (Contrastive Language-Image Pre-training) 论文解读
CLIP 是多模态和通用人工智能(AGI)领域的里程碑式工作。自然语言是一种极其强大的监督信号。它比离散的数字或类别标签(如 0, 1, 2)蕴含着更丰富、更密集的语义信息,能够极大地提升视觉模型的表征能力。多模态对比学习 + 大规模数据 = 强泛化能力。这种范式颠覆了传统的计算机视觉训练模式,开启了“视觉基础大模型”的时代。催生了新一代生成式 AI:CLIP 不仅本身具备强大的检索和分类能力,它还成为了后续众多突破性文生图(Text-to-Image)模型(如DALL-E 2Midjourney。
2026-05-06 09:46:17
563
原创 大模型原理:理解生成式模型和语言模型
以前的人工智能,更多说的是“判别式模型”。比如上传一张照片给模型,它会判断“这是一只猫”还是“这是一只狗”。这种模型叫“判别式模型”,它关心的是分类的结果。而生成式模型,顾名思义,他做的事情是“凭空造出什么”。它通过学习海量的数据,掌握了这些数据背后的潜在规律。模型学成之后,它可以根据这些规律,从零开始生成一张新的图片,这张图片在现实中并不存在,但看起来却非常真实。不管是生成全新的文字、图片、还是视频和音乐,只要是“无中生有”的新东西,利用的都是生成式模型。圈内代表作有什么?GAN(生成对抗网络)
2026-05-06 09:44:51
386
原创 GPT3论文深度解读
Tom B. Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah 等 (OpenAI, 2020)在 GPT-2 证明了生成式模型具备 Zero-Shot(零样本)潜力的一年后,OpenAI 发布了参数量高达 1750 亿的“庞然大物” GPT-3。。
2026-04-23 10:04:44
419
原创 GPT-1 论文深度解读
优点:通用性强,泛化能力优秀;训练框架简单统一;极大地降低了对大规模高质量特定任务标注数据的依赖。局限性:由于是单向语言模型(仅用左侧上下文预测右侧),在一些需要双向深度语境信息的任务(如阅读理解中的填空)上表现不如稍后推出的双向模型 BERT。但长远来看,单向自回归架构在生成式任务上取得了压倒性优势。
2026-04-23 10:03:54
567
原创 Vision Transformer (ViT) 论文深度解析
ViT (Vision Transformer) 是一个具有里程碑意义的工作。它用一种极其简单、暴力且干净的方式告诉研究者们:如果算力和数据都足够,放弃那些繁杂的人为设计先验结构,拥抱更加通用的 Transformer 架构,是通往更大规模智能的可行方案。
2026-04-13 08:30:00
740
原创 EfficientNetV2 论文深度解读
大图像尺寸导致训练缓慢:V1 常常为了追求高精度而使用非常大的输入分辨率,严重影响了计算和训练效率。深度卷积(Depthwise Convolutions)在早期的网络层速度慢:深度卷积虽然参数量少,但在硬件上的底层算子优化往往不及普通卷积高效。等比例的扩展策略并不是最优的:无论深度、宽度还是分辨率,每一层不一定都需要按照同样的比例进行扩展。追求更高的效率(Faster Training)和更小的模型尺寸(Smaller Models)。
2026-04-13 08:30:00
335
原创 Linux下离线安装timm
PyTorchImageModels,简称 timm,是一个巨大的 PyTorch 代码集合。里面包含了很多视觉模型的预训练模型,例如:ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt等。
2026-04-08 20:03:28
237
原创 Antigratity编程实用指南
传统 AI 往往是问答模式,通过向AI发送指令,指导AI输出代码。Antigravity 引入了Agentic Mode(代理模式),使其具备了自主工作的能力。PLANNING (规划)它不会立即写代码,而是先分析你的 codebase。它会生成一个,列出它打算修改哪些文件、如何修改以及如何验证。关键点:这是你介入的最佳时机。如果计划有误,现在纠正比代码写完后改要容易得多。EXECUTION (执行)获得批准后,它开始执行。它会创建文件、修改代码、运行终端命令。它会实时更新task.md。
2026-02-08 17:21:19
949
原创 Agent skills简介
简单来说,就像是为 AI 智能体安装的“扩展包”或“插件”。从技术角度看,Skill 通常是一个包含特定指令、脚本和资源的文件夹。它是对智能体能力的模块化扩展。SKILL.md(核心):这是技能的“说明书”。它包含 YAML 头部(定义名称、描述)和详细的 Markdown 指令,告诉智能体在什么情况下使用该技能,以及具体的操作步骤。Scripts(脚本):辅助智能体执行任务的自动化脚本(如 Python 或 Shell 脚本)。Resources(资源):模板文件、配置文件或参考文档。
2026-02-08 17:20:53
556
原创 掌握 Claude Code:从入门到高效开发的实用指南
Claude Code 是一个基于终端的工具,它直接集成在你的开发环境中。与传统的 IDE 插件不同,它更像是一个不知疲倦的结对编程伙伴(Pair Programmer)。核心优势:深度上下文理解:它能扫描和索引你的本地文件,理解项目结构。终端集成:可以直接运行测试、git 命令、文件操作等。Agentic 工作流:能够规划任务步骤,而不仅仅是回答问题。Claude Code 是一个能极大提升生产力的工具,前提是你把它当作一个优秀的初级/中级工程师。
2026-02-01 20:34:07
1121
原创 Clawbot (OpenClaw)简介
OpenClaw 是一个“消息优先(Messaging-First)”的 AI 助理, 它是一个可以运行在自己设备上的私人AI助手。它的核心理念是将强大的 AI 能力无缝集成到你日常沟通的工具中。尽管现在有层出不穷的AI助手,但是大多数工具都要求你打开特定的网页或者 App。而OpenClaw 就像你的朋友一样,活在你最常用的聊天软件里(比如:Telegram, Discord, Slack),并且运行在你自己的电脑上,保护你的隐私。
2026-02-01 20:32:07
2348
原创 大模型微调 (Fine-Tuning) 指南
预训练 (Pre-training)过程:让模型阅读海量的互联网文本(维基百科、书籍、代码等)。结果:模型学会了语法、逻辑、常识,拥有了广泛的通识知识。类比:这是一个刚刚毕业的大学生,博学多才,但没进公司接受过培训,不懂具体的业务流程。微调 (Fine-tuning)过程:在预训练模型的基础上,使用特定领域的、高质量的小数据集进行进一步训练。结果:模型掌握了特定领域的知识、术语或指令跟随能力。类比:这是对大学生的**“入职培训”**。
2026-01-29 23:15:58
1111
原创 windows 安装claude code 教程
Claude Code 是 Anthropic 推出的 AI 编程助手,可以直接在终端中运行,帮助你理解代码库、编辑文件和执行任务。Claude code 可以安装在Linux / macOS / windows 平台上。本教程将指导你在 Windows 10 系统上安装和配置。
2026-01-29 23:14:44
2317
1
原创 图像分割 - DeepLabv3+论文解读
DeepLabv3+ 是 DeepLab 系列的集大成者。它通过引入 Encoder-Decoder 结构解决了 deeplabv3 边缘分割不够精细的问题,并利用深度可分离卷积(Xception)大幅提升了计算效率和性能。至今,它仍是工业界语义分割任务的首选基准模型之一。
2026-01-24 09:05:49
801
原创 图像分割 - DeepLabv3 论文深度解读
无需 CRF:DeepLab v3 展示了纯 CNN 架构(配合强大的 ASPP)足以生成精细的分割结果,甚至优于之前带 CRF 的模型。性能:在 PASCAL VOC 2012 基准测试中,DeepLab v3 取得了当时的 State-of-the-art 性能。DeepLabv3 通过精细设计的 ASPP 模块(结合空洞卷积、BN 和全局特征),有效地解决了语义分割中的多尺度和分辨率问题。它的架构简洁高效,不仅去除了复杂的 CRF 后处理,还提供了极佳的分割精度,是语义分割领域的经典之作。
2026-01-24 09:05:13
721
原创 图像分割 - PSPNet (Pyramid Scene Parsing Network)论文解读
PSPNet 是一篇非常扎实的工程化论文。它没有极其复杂的数学推导,而是基于对“感受野”和“上下文”的深刻理解,设计了一个优雅的模块。给 AI 从业者的 Takeaway:在做视觉任务时,永远不要忽视全局信息。局部特征决定细节,全局特征决定“它是什么”。金字塔结构(Pyramid)是处理多尺度物体的通用解法,不仅在分割中有效,在检测(如 FPN)中同样适用。论文中对 BatchSize 的调整、数据增强(随机旋转、缩放)以及“Poly”学习率策略的坚持,是其达到 SOTA 的重要保障。
2026-01-18 22:15:13
925
原创 Antigravity简介
Antigravity 旨在解决复杂的编程任务。主动规划:将大任务拆解为小步骤。自主执行:使用终端、文件编辑器和浏览器等工具。自我验证:运行测试并根据结果修复错误。维护状态:通过“Artifacts(产物文档)”跟踪项目进度和上下文。
2026-01-18 22:12:58
1145
原创 深度学习模型部署
深度学习模型部署是一个系统工程,需要综合考虑性能、成本、可维护性和扩展性。成功的部署不仅需要技术能力,还需要理解业务需求、硬件限制和运维要求。随着AI应用的普及,部署技术正朝着自动化、标准化和多样化的方向发展,为不同场景提供更加优化的解决方案。
2026-01-11 23:31:25
1347
原创 深度学习模型部署形式
部署方式优点缺点核心技术云端 API算力无限、易于维护、多端通用依赖网络、有隐私风险、带宽贵边缘设备响应极快、无需网络、安全硬件成本高、维护困难手机端侧零服务器成本、极致隐私电池损耗、算力有限、模型需压缩大模型私有化数据安全、定制化强显存门槛高、技术要求高。
2026-01-11 23:30:34
1021
原创 docker常用命令
掌握这些 Docker 常用操作后,你将能够更加自如地管理容器化应用。记住,实践是最好的学习方式——多动手操作,遇到问题查阅官方文档,你会很快成为 Docker 使用高手。Docker 的世界还有很多高级功能等待探索,但这些基础操作已经能够覆盖 80% 的日常使用场景。使用命令别名可以大幅提高效率,例如在~/.bashrc。
2026-01-03 22:03:07
1013
原创 python报错:AttributeError: module ‘numpy‘ has no attribute ‘object‘.
在使用python numpy的时候,报错:AttributeError: module ‘numpy’ has no attribute ‘object’.这个错误通常是由于NumPy版本更新导致的,因为 np.object 在较新版本中已被弃用。方法2: 直接将代码中的 np.object 替换为 Python 内置的 object:方法3:可以保持向后兼容2. 问题延伸问题描述:File “/usr/local/lib/python3.8/dist-packages/tensor
2026-01-03 22:01:43
1027
原创 大模型核心原理-关键技术解析:预训练、SFT、RLHF
预训练(Pre-training):通过海量数据提炼出蕴含智慧的基座模型。这一步最贵,消耗算力最大。将基座模型进行优化,让它具备对话能力。打磨细节,去除杂质,让它对齐人类价值观。正是这三个步骤的精密配合,才让我们拥有了今天这样强大、智能的 AI 助手。如果你觉得这篇文章对你有帮助,欢迎转发分享!关于大模型技术你还有什么想了解的?在评论区告诉我吧!
2025-12-17 23:40:32
1269
1
原创 GPT进展:从GPT-1到GPT-5
本文主要梳理 GPT(Generative Pre-trained Transformer)家族的发展史。随着数据和技术的更新,GPT模型的能力也越来越强。模型越来越大,数据越来越多,从“续写文字”变成了“理解指令”和“逻辑推理”。模型核心突破你的感觉GPT-1证明了“预训练”这条路走得通“这是啥?好像有点意思但没啥用。GPT-2证明了“模型越大越智能”“哇,它编的故事好逼真!GPT-3拥有了通用能力,不用微调“天哪,它什么都会,就是有点不受控。GPT-3.5学会了听从人类指令 (RLHF)
2025-12-17 23:38:51
1095
1
原创 pytorch nn.CrossEntropyLoss
不要加 Softmax:模型的最后一层直接输出 Linear 层的结果即可,不要画蛇添足。标签要是索引:Target 应该是[0, 2, 1]这样的整数索引,而不是 One-hot 向量。类型要对齐:预测值是 Float,标签值是 Long。希望这篇教程能帮你彻底搞定 PyTorch 中的交叉熵损失函数!如果你在实际操作中遇到了问题,欢迎在评论区留言,我们一起探讨。
2025-12-07 23:17:48
987
1
原创 Labelme安装教程
通过使用 Anaconda 创建一个隔离的虚拟环境,我们为 LabelMe 提供了一个纯净且稳定的运行空间,这是最专业、最可靠的安装方式。希望这篇保姆级教程能帮助你顺利迈出计算机视觉项目的第一步。祝你标注愉快!
2025-12-07 23:15:17
1277
原创 PyTorch 转 ONNX 实用教程
ONNX 是一个用于机器学习模型的开放格式,旨在解决不同框架之间的模型互操作性和跨平台部署问题。它是一个中间表示格式,当你使用一个框架训练模型,但需要在另一个不同的框架中运行它时,可以使用 ONNX 进行转换。或者当你需要将模型部署到不同的硬件设备上时,例如从云端的 GPU 迁移到边缘设备的 CPU 时,ONNX 可以提供一个通用的部署桥梁。
2025-12-03 23:35:39
590
原创 大模型原理:Transformer简介
Transformer是一种采用注意力机制(Attention Mechanism)的深度学习架构,它摒弃了RNN的循环结构,可以按输入数据各部分重要性的不同而分配不同的权重。它最初被应用于机器翻译任务,并取得了巨大成功,此后迅速成为NLP领域的标准模型架构。Transformer的核心优势在于其自注意力机制(Self-Attention)。该机制允许模型在处理一个单词时,能够同时关注到输入序列中的所有其他单词,并计算它们之间的相关性权重。这种全局视野使得模型能更有效地捕捉长距离依赖关系。
2025-11-19 13:11:00
869
原创 大模型原理:大模型运行的基本机制
例如,“猫”的向量会离“狗”和“宠物”更近,而离“汽车”和“天空”更远。这种向量化的表示方法,使得模型能够在数学层面上理解和推理词与词之间的关系,比如类比关系(“国王” - “男人” + “女人” ≈ “女王”)。在处理第二个“水”时,则会更关注“一杯”这个词。:模型会从这个列表中选择一个词元(通常是概率最高的那个),然后将这个新生成的词元添加到输入序列中,再次作为新的输入来预测再下一个词元。顾名思义,它允许模型在处理一个词元时,能够“关注”到输入序列中的所有其他词元,并为每个词元分配一个“注意力分数”。
2025-11-18 23:36:05
1106
原创 让大模型更好用的三种方法:Prompt,外挂知识库和微调
提示词工程、外挂知识库和微调并非相互排斥,在实际应用中,将它们结合使用往往能发挥出最大的威力。例如,可以先对一个模型进行微调,使其适应特定领域的语言风格,然后通过RAG为其接入实时更新的业务数据,最后再通过精心设计的提示词来优化最终的输出质量。理解这三种方法的原理和适用场景,将帮助你更好地驾驭大型语言模型,让这个强大的工具在你的工作和生活中发挥出真正的价值。
2025-11-11 23:36:04
1227
原创 python -m的使用方法
python -m不仅仅是运行 Python 脚本的另一种方式,更是一种遵循 Python 模块和包规范的实践。它通过修改模块搜索路径的机制,优雅地解决了复杂的导入问题,并为我们提供了一种统一、可靠的方式来执行标准库模块和第三方包。下次当你遇到难以捉摸的,或者想要更方便地使用 Python 自带的工具时,不妨试试python -m,它或许能为你打开一扇新的大门。
2025-11-11 23:34:19
810
原创 大模型提示工程指南
简单来说,提示工程是设计和优化输入(即“提示”),以引导大语言模型(LLM)等生成式AI产生期望输出的过程。这不仅仅是简单地提问,而是通过精心设计的指令、上下文、甚至是范例,来精准地指导AI的思考路径和回应方式。在一个AI技术日益融入我们生活的时代,掌握提示工程变得至关重要。无论是内容创作、客户服务自动化,还是软件开发和数据分析,高质量的提示都是解锁AI全部潜能的钥匙。一个好的提示,能将一个通用的AI模型,瞬间转变为特定领域的专家。
2025-11-03 23:35:31
667
原创 AIGC与大模型
总而言之,AIGC 和大模型是同一场技术革命的两个侧面。大模型是深藏于内的、强大的技术核心,而 AIGC 则是其绚丽多彩、影响深远的应用外壳。当我们惊叹于 AIGC 带来的无限创意时,我们实际上是在见证大模型这项基础技术所释放的巨大潜能。理解了这层关系,你不仅能更好地使用这些 AI 工具,更能洞察未来科技发展的浪潮之巅。
2025-10-30 23:51:16
898
原创 一文读懂模型上下文协议 (MCP)
如果 AI 不仅能“说”,还能“做”,将释放无限潜能,这正是 MCP 要解决的问题。同样,在 MCP 出现之前,让 AI 模型连接到每一个外部工具或数据源,都需要编写定制化的代码,这是一个复杂且碎片化的过程。无论是连接数据库、调用 GitHub API,还是操作本地文件系统,Agent 都无需关心底层实现的差异,只需通过 MCP 发送标准化的请求即可。Agent 是让 AI “动起来”的关键。简而言之,如果说大模型是 AI 的“大脑”,那么 MCP 就是赋予它与物理世界和数字世界交互能力的“手和脚”。
2025-10-29 17:02:01
840
原创 RAG(检索增强生成)
自ChatGPT问世以来,大型语言模型(LLM)以前所未有的速度改变着我们与信息和技术互动的方式。然而,尽管这些模型功能强大,它们也存在固有的局限性,例如知识截止日期、信息“幻觉”以及无法访问私有或实时数据等问题。为了克服这些挑战,一种名为“检索增强生成”(Retrieval-Augmented Generation,简称RAG)的技术应运而生,并迅速成为构建更强大、更可靠AI应用的关键。本文将带你深入了解RAG,探索它是什么,为何重要,以及如何利用它来释放大型语言模型的全部潜力。
2025-10-27 23:32:17
696
1
原创 AI Agent:您的智能自动化新伙伴
AI Agent是一种能够感知其环境、进行自主决策并采取行动以实现特定目标的软件程序。您可以将其想象成一个拥有“大脑”(通常由大型语言模型驱动)、能够使用“工具”(如API、数据库)并拥有“记忆”(短期和长期)的智能体。它们被设计为能够自主地为用户完成复杂的、多步骤的任务。AI Agent可以在没有人为干预的情况下独立运作和做决策。它们致力于实现用户设定的具体目标。AI Agent能够通过传感器或数字输入感知其所处的环境,并与外部系统进行交互。
2025-10-26 20:54:32
986
原创 vibe coding(氛围编程)简介
Vibe Coding直译为“氛围编程”,是一种新兴的软件开发实践,它利用人工智能(AI),特别是大型语言模型(LLM),将开发者的自然语言指令转化为功能性代码。这个词由著名人工智能学者 Andrej Karpathy 在2025年2月提出,他将其描述为一种“完全凭感觉,拥抱指数级增长,忘记代码存在”的编程方式。Vibe Coding 的本质是"完全沉浸于"AI 助手的"氛围"中,将详细的实现过程外包给 AI。与传统编程需要逐行编写和调试代码不同,氛围编程的核心在于“意图驱动”。
2025-10-25 22:33:02
2115
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅