CAN (Condition-Aware Neural Network)_can神经网络-CSDN博客

本文链接：https://blog.csdn.net/qq_29788741/article/details/138293086

本文介绍了一种新的图像生成模型控制方法——条件感知神经网络(CAN)，通过动态调整权重来增强扩散Transformer模型。实验表明，CAN在ImageNet和COCO任务中表现出色，提供显著性能提升且计算成本低。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文提出的 CAN 模型 (Condition-Aware Neural Network) 是一种对图像生成模型添加控制的方法。CAN 可以通过动态操纵神经网络的权重来控制图像生成过程。作者在 ImageNet 图像生成任务以及 COCO 文生图任务上面测试了 CAN 方法。CAN 始终为扩散 Transformer 模型提供显著的改进，比如 DiT 和 UViT。

本文提出的 CAN 模型 (Condition-Aware Neural Network) 是一种对图像生成模型添加控制的方法。CAN 可以通过动态操纵神经网络的权重来控制图像生成过程。如图1所示，具体的方法是通过一个条件感知权重生成模块，这个模块的输入是条件 (比如类别标签，时间步)，作用是为卷积/线性层生成权重。作者在 ImageNet 图像生成任务以及 COCO 文生图任务上面测试了 CAN 方法。CAN 始终为扩散 Transformer 模型提供显著的改进，比如 DiT 和 UViT。

图1：CAN 的输入是条件信息，然后动态生成神经网络的权重，与原始模型的权重混合

本文做了什么工作

引入了一个控制图像生成模型的新机制：通过操控权重来控制条件生成模型。
提出了条件感知神经网络，一种用于条件图像生成的控制方法。
CAN 可以用来提升图像生成模型的性能，大大优于之前的方法，而且对部署很有帮助。比如在 ImageNet 512×512 的图像生成任务，CAN 方法的 FID 比 DiT-XL/2 更小，且每个采样步骤的 MACs 少 52 倍，为边缘设备上的扩散模型应用提供支持。

效果图如下图2所示。