自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(450)
  • 收藏
  • 关注

原创 基于YOLO26/11/v8算法的Web目标检测系统,人脸表情识别系统,Django+Vue3 的前后端分离,实现摄像头实时识别,YOLO26/YOLO11/v8 + LLM大模型智能分析,科研必备

在人工智能迈向通用化(AGI)的今天,“视觉感知 + 语言理解”的多模态联合是未来的趋势。单纯的检测画框已经无法满足复杂的业务需求,如何让系统“看懂”画面并进行“思考”,是当前视觉项目的重点。我们知道目标检测是计算机视觉中的重要任务,广泛应用于安防监控、自动驾驶、智能家居等领域。因此本项目将 YOLO 目标检测模型(兼容 YOLO26/v11/v8 系列)与 DeepSeek 等顶流大语言模型(LLM) 进行联合,使用 Django (后端) + Vue3 (前端) 技术栈

2026-03-03 17:20:30 1567

原创 基于ResNet + LLM大语言模型的分类识别系统设计与实现,Web前后端分离,Django+vue3+AI助手模块+ResNet50算法+LLM 联动+Element Plus等技术,全网独发

分类识别任务是计算机视觉中的重要任务,广泛应用于智慧校园分类、智慧农业、智慧生活场景分类等领域。常见的分类模型有 VGGNet、ResNet 、MobileNet 、ConvNeXt、DenseNet、ViT、Swin Transformer、YOLOv8/11/26。本项目结合 ResNet分类识别算法 + LLM大语言模型联动 ,使用 Django + Vue3,构建了一个通用的 Web 前后端系统,用户端 + 管理端 ,便于用户操作检,不仅可以用于大论文的工作量展示,还可以作为毕业设计。

2026-01-29 17:28:29 474

原创 AutoDL使用教程,以PaddleOCR在服务器训练为例子,使用AI远程服务器训练深度学习、多模态、AI大模型训练等,包括Xshell和Xftp安装、服务器环境配置等,linux常用命令,超w字教程

AutoDL使用教程,以PaddleOCR在服务器训练为例子,使用AI远程服务器训练深度学习、多模态、AI大模型训练等,包括Xshell和Xftp安装、服务器环境配置等,linux常用命令,超w字教程

2025-12-21 00:39:06 1556

原创 《人工智能实战:深度学习模型改进与系统部署》,改进专栏目录和介绍

专深度学习相关项目都写在本专栏,《一次订阅解锁全部,都有源码,永久观看》,包括车牌识别、股票预测、人脸识别、风格迁移、图像修复、图像超分辨重建、图像分割等任务,Web/PyQt系统实现。引入Transformer、Swin Transformer、DenseNet、ViT、ConvNeXt等算法实战,提供卷积改进,魔改对比实验,模型剪枝,模型蒸馏,模型量化,全网独家整合改进专栏,为不同领域的同学发表论文提供了大力支持。

2025-06-25 12:57:12 2203 1

原创 基于Django+Vue3的目标检测系统设计与实现,Web前后端分离,Vue3前台系统+Django后台管理系统开发,YOLOv11 Web目标检测,实现图片、视频和摄像头检测等功能,全网独发

基于Django+Vue3的智能目标检测系统设计与实现,Web前后端分离,YOLOv11 Web目标检测,Vue3前台系统+Django后台管理系统开发,实现图片检测、视频检测、摄像头检测、登录、注册和个人中心功能

2025-04-05 01:45:49 3292 1

原创 基于Django+Vue3的智能目标检测系统设计与实现,Vue3前台系统+Django后台管理系统开发,Web前后端分离,YOLOv8 Web目标检测,实现图片、视频和摄像头检测等功能,全网独发

目标检测是计算机视觉中的重要任务,广泛应用于安防监控、自动驾驶、智能家居等领域。YOLO系列模型由于其高效的检测速度和较高的准确率,成为目标检测任务的首选算法之一。本项目结合 YOLOv8 与 Django + Vue3,构建一个Vue3前台系统+Django后台管理系统开发,便于用户进行目标检测的操作和展示,实现对图片、视频实时目标检测,不仅可以用于大论文的工作量展示,还可以作为毕业设计。支持更换自己模型、图片检测、实时视频检测、置信度调节和IoU参数调节。同时支持目标检测、实例分割、关键点检测等任务

2025-03-29 01:27:00 5028 5

原创 YOLOv8/YOLOv11目标检测系统与多目标跟踪检测系统,使用PySide6搭建目标检测系统,支持目标检测、分割、姿势估计、旋转框,用户端系统+后台管理系统可用于大论文凑工作量或毕设必备

YOLOv8/YOLOv11目标检测系统与多目标跟踪检测系统,目标检测、分割、姿势估计、obb(旋转框),用户端系统+后台管理系统开发实战,可用于大论文凑工作量或毕设必备,全网最详细教程,系统支持 目标检测、分割、姿势估计、obb(旋转框)等模型进来检测,是一个通用的目标跟踪与目标检测系统,适配多种场景如:鱼苗检测与跟踪、行人多目标跟踪、车辆多目标跟踪、牛只行为识别与跟踪、口罩佩戴检测、安全帽佩戴检测、火灾检测等。

2024-11-08 14:30:03 10577 20

原创 《手把手教你YOLOv10实战》,专栏目录和介绍

在计算机视觉领域,目标检测技术一直是研究和应用的热点,而YOLO系列算法凭借其高效性和精确性,成为了广泛应用的选择。YOLOv10作为YOLO系列的最新版本,继承并扩展了前辈的优点,同时也带来了许多创新和改进。本专栏将手把手教你掌握YOLOv10的实战技巧,包括算法改进、环境配置和训练自己数据集等,让你能够迅速上手并应用到实际项目中。

2024-09-14 09:44:00 3115 8

原创 《手把手教你YOLOv9实战》,改进专栏目录

为了提供友好的操作效果,本专栏将会手把手搭建可视化界面,我将用PyQt5 搭建一个可视化界面,可视化界面能够实现基本的图像加载与检测功能,如支持视频、摄像头,还支持更换不同的 YOLOv9 模型,并适应不同领域(如口罩检测系统、人脸检测系统、工业缺陷检测系统等),界面灵活、功能强大。通过YOLOv9加以改进设计,形成新的算法框架,一起水科研和论文,专栏会一直持续更新中,本专栏适合目标检测、分割、分类。

2024-08-09 14:48:14 1837 2

原创 《YOLO26/YOLO11/YOLOv8改进与系统实战》,改进与系统实战专栏目录和介绍

YOLOv8 是目前比较火和比较成熟的深度学习框架,是2023年1月发布的,由 Ultralytics 团队开发。Ultralytics自YOLOv5 开始一直积极维护和更新 YOLO 框架,因此 YOLOv8 也享有持续的维护与升级支持。因此我写下《手把手教你YOLOv8实战》专栏,专门为那些对计算机视觉、深度学习、以及目标检测技术感兴趣的读者设计。通过本专栏,你将深入理解 YOLOv8 的核心原理与实际应用,从0 开始学习并掌握如何使用 YOLOv8 完成各类目标检测任务,帮助你快速上手并掌握 YOLO

2024-08-09 10:47:42 16817 19

原创 Claude Code 安装教程,claude code 无法连接到 Anthropic 服务,VS Code 添加 claude code,记录版

本地需要安装有Node.js 安装,请确保你的环境已安装 Node.js 18+ 版本,也有可能需要安装 git 工具,这些我都安装了,可以看看我专栏的教程安装一下。

2026-04-08 11:18:38 52

原创 sam3本地部署

官网地址:https://github.com/facebookresearch/sam3/tree/main。

2026-04-08 00:04:23 97

原创 unet复现

哈喽,大家好,这里是落花不写码,本次教程讲一下 U-Net 分割篇,U-Net 它是一篇 2015 年发表的论文,那为什么到现在还需要讲呢?因为后续讲到 GAN、扩散模型时候是离不开 U-Net 架构的,所以今天先带大家使用 U-Net 模型完成一些图像分割。

2026-04-07 23:48:10 258

原创 image-restoration-sde复现,图像修复,使用均值回复随机微分方程进行图像修复,ICML 2023

PyQt5/PySide6/Django+Vue3等都可以。

2026-04-06 18:25:07 470

原创 ConvNeXt 改进 :ConvNeXt添加IDWConv( Inception深度卷积,CVPR 2023),实现高效涨点,二次创新CNBlock结构 ,独家首发

本文通过将 Inception 多分支结构 缝合进 ConvNeXt Block,利用空间维度的解耦策略,用轻量化的条形卷积(Band Convolution)替代臃肿的正方形大核。实验表明,该改进方案在不改变 ConvNeXt 宏观架构的前提下,显著扩大了模型的有效感受野,并大幅降低了推理延迟,为构建更高性能、更易部署的视觉 Backbone 提供了有力支撑。从“单路径大核”到“多路径分解”将通道维度等比例切分为四个独立分支。

2026-04-05 15:41:19 21

原创 ConvNeXt 改进 :ConvNeXt 添加IIA注意机制(信息整合注意力,TGRS 2025),二次创新CNBlock结构 ,实现涨点,独家首发

本文解析的是发表于遥感顶刊 IEEE TGRS 2025 上的核心注意力模块 —— IIA (信息交互注意力)。在实时城市语义分割任务中,如何捕捉图像的长程空间依赖同时兼顾计算效率是长期的难题。IIA 模块打破了传统注意力机制仅在空间或通道单一维度进行建模的局限。它通过**维度置换(Dimension Permutation)**策略,将特征图分别在水平和垂直方向进行解耦,利用轻量化的 1D 卷积捕捉跨维度的结构关联。

2026-04-05 15:18:48 11

原创 ConvNeXt 改进 :ConvNeXt添加PATConv卷积(部分注意力卷积,AAAI 2026),在减少计算量的同时融合卷积与注意力,二次创新CNBlock结构 ,独家首发

PartialNet 及其核心算子 PATConv。在追求端侧实时推理的过程中,传统的 PConv(部分卷积)虽然显著降低了冗余计算,但也因固定的通道采样模式限制了模型对复杂特征的表达能力。PartialNet 创新性地提出了基于注意力引导的部分卷积(Partial Attention-based Convolution, PATConv)。该架构通过在部分通道分支中引入轻量化的注意力动态感知机制,实现了计算资源在空间和通道维度上的自适应分配。

2026-04-05 12:21:32 120

原创 ConvNeXt 改进 :ConvNeXt添加MKDConv(多核深度卷积,ICCV 2025),二次创新CNBlock结构 ,独家首发

本文解析的是发表于 ICCVW 2025 的轻量化医学影像分割网络 MK-UNet。在医学图像处理领域,病灶(如肿瘤、息肉)的尺度变化剧烈,传统的单核 CNN 难以平衡局部细节与全局上下文,而 Transformer 模型虽性能优异但计算开销巨大。MK-UNet 提出了一种多核卷积块(MK-Block),通过并行集成不同尺寸的卷积核,使模型在保持极低参数量(仅 1.5M 左右)的同时,具备强大的多尺度特征感知能力。

2026-04-05 11:17:47 157

原创 ConvNeXt 改进 | 自研模块:LLM 的 AttnRes残差自注意力模块 + GAM 通道注意机制(Kimi 团队 2026),自研AttnRes-GAM注意力残差块 ,实现高效涨点,独家首发

本文解析的是由 Kimi (月之暗面) 团队发布的最新技术报告 《Attention Residuals》。在传统 Transformer 架构中,注意力模块产生的输出直接与残差流(Residual Stream)进行加法合并。然而,Kimi 团队研究发现,随着模型规模和上下文长度的不断增加,注意力输出往往会逐渐“主导”或“污染”残差流,导致模型在深层训练时出现收敛困难和特征坍塌。为此,Kimi 团队提出了一种全新的注意力残差化(Attention Residualization)方案。

2026-04-02 16:41:05 477

原创 ConvNeXt 改进 :ConvNeXt 添加DHOGSA注意机制(HOG感知自注意力模块,AAAI 2026),二次创新CNBlock结构 ,实现涨点,独家首发

本文解析的是 AAAI 2026 录用的核心成果 —— HOGformer 及其核心算子 Attention_DHOGSA。该研究通过“老瓶装新酒”,重新审视了经典的 HOG(方向梯度直方图) 描述子,并将其转化为一种显式的梯度条件先验。DHOGSA(动态 HOG 感知自注意力) 机制通过实时提取输入图像的梯度强度与方向,引导自注意力权重在空间上进行动态分布。

2026-04-02 14:02:37 203

原创 ConvNeXt 改进 :ConvNeXt添加DCNv3(可变形卷积,CVPR 2023),无需编译,二次创新CNBlock结构 ,独家首发

本文解析的是 CVPR 2023 的模型 InternImage。在视觉大模型普遍转向 Vision Transformer (ViT) 的背景下,InternImage 另辟蹊径,使用改进版可变形卷积(DCNv3的全新架构。通过将 DCN 的动态稀疏特性与现代大模型的扩展定律(Scaling Laws)相结合,InternImage 成功将 CNN 的参数量推向了 10 亿(1B) 级别。

2026-04-01 14:22:32 373

原创 ConvNeXt 改进 :ConvNeXt添加可变形卷积(DCNv2,CVPR 2018),实现高效涨点,二次创新CNBlock结构 ,独家首发

DCNv2对原始的DCNv1进行了改进,可变形卷积网络的卓越性能源于其适应对象几何变化的能力。通过对其自适应行为的检查,虽然对其神经特征的空间支持比常规的ConvNets更接近于对象结构,但这种支持可能远远超出感兴趣区域,导致特征受到不相关图像内容的影响。为了解决这个问题,我们提出了一种可变形卷积网的重新表述,通过提高建模能力和更强的训练,提高了其专注于相关图像区域的能力。通过更全面地集成网络中的可变形卷积,并引入扩展变形建模范围的调制机制,增强了建模能力。

2026-04-01 14:10:24 160

原创 ConvNeXt 改进 :ConvNeXt采用WTConv卷积(感受野的小波卷积),ECCV 2024,实现高效涨点,二次创新CNBlock结构 ,独家首发

WTConv(基于小波变换的卷积层),用于在卷积神经网络(CNN)中实现大感受野。作者通过利用小波变换,设计了一个卷积层,可以在保持少量可训练参数的情况下大幅扩大感受野。WTConv 被设计为可以无缝替换现有 CNN 架构中的深度卷积层,适用于图像分类、语义分割、物体检测等任务。WTConv 的核心思想是通过结合卷积神经网络(CNN)的强大特征提取能力与小波变换的多尺度特性,来实现大感受野的卷积操作,同时避免传统大卷积核带来的参数爆炸问题。

2026-03-31 18:09:44 123

原创 ConvNeXt 改进 :ConvNeXt结合DynamicConv(动态卷积),CVPR2024,实现高效涨点,二次创新CNBlock结构 ,独家首发

大规模视觉预训练显著提高了大规模视觉模型的性能。现有的低 FLOPs 模型无法从大规模预训练中受益。在本文中,作者提出了一种新的设计原则,称为 ParameterNet,旨在通过最小化FLOPs的增加来增加大规模视觉预训练模型中的参数数量。利用 DynamicConv 动态卷积将额外的参数加入到网络中,而几乎不增加FLOPs。ParameterNet 方法使低 FLOPs 网络能够受益于大规模视觉预训练。

2026-03-31 18:02:50 114

原创 ConvNeXt 改进 :ConvNeXt添加GnConv递归门控卷积,二次创新CNBlock结构 ,独家首发

视觉 Transformer 在多种任务中取得了显著的成功,这得益于基于点积自注意力的新空间建模机制。视觉 Transformer 中的关键因素——即输入自适应、长距离和高阶空间交互——也可以通过卷积框架高效实现。作者提出了递归门控卷积(Recursive Gated Convolution,简称 gnConv),通过门控卷积和递归设计执行高阶空间交互。该新操作具有高度的灵活性和可定制性,兼容各种卷积变体,并将自注意力中的二阶交互扩展到任意阶数,而不会引入显著的额外计算。

2026-03-30 18:00:20 126

原创 ConvNeXt 改进 :ConvNeXt添加RFAConv卷积创新空间注意力和标准卷积,包括RFCAConv, RFCBAMConv,实现高效涨点,二次创新CNBlock结构 ,独家首发

空间注意力已广泛应用于提升卷积神经网络(CNN)的性能,但它存在一定的局限性。作者提出了一个新的视角,认为空间注意力机制本质上解决了卷积核参数共享的问题。然而,空间注意力生成的注意力图信息对于大尺寸卷积核来说是不足够的。因此,提出了一种新型的注意力机制——感受野注意力(RFA)。现有的空间注意力机制,如卷积块注意力模块(CBAM)和协调注意力(CA),仅关注空间特征,未能完全解决卷积核参数共享的问题。相比之下,RFA不仅关注感受野的空间特征,还为大尺寸卷积核提供有效的注意力权重。

2026-03-30 17:51:47 131

原创 ConvNeXt 改进 :ConvNeXt 添加ConvolutionalGLU模块,CVPR2024,二次创新CNBlock结构 ,独家首发

由于残差连接中的深度退化效应,许多依赖堆叠层进行信息交换的高效视觉Transformer模型往往无法形成足够的信息混合,导致视觉感知不自然。为了解决这个问题,作者提出了一种聚合注意力(Aggregated Attention),这是一种基于仿生设计的token混合器,模拟了生物的中央凹视力和连续眼动,同时使特征图上的每个token都具有全局感知能力。此外,作者引入了可学习的token,这些token可以与传统的查询和键进行交互,从而在生成亲和矩阵时不仅仅依赖于查询和键之间的相似性。

2026-03-29 10:52:15 163

原创 ConvNeXt 改进 :ConvNeXt添加B2CNet的BFAM(双时相特征聚合模块)JCR Q1 区 2024, 实现高效涨点,二次创新CNBlock结构 ,独家首发

B2CNet网络结合变化边界感知并引入“由边到中心(boundary-to-center)”理念的新型变化检测网络。该网络引入了一个变化边界感知模块(CBM),用于捕获变化区域的边界信息。该模块能够增强边界特征,减少特征差分中噪声的影响,并提供丰富的上下文信息以提高变化边界的准确性。此外,作者提出了一个基于时空特征的双时相特征聚合模块(BFAM)。BFAM 聚合多感受野特征并补充纹理信息。这两个模块均采用 SimAM 注意力机制,以增强特征的细粒度表达,因此本文将引入BFAM模块,二次创新结构。

2026-03-29 10:15:07 110

原创 ConvNeXt 改进 :ConvNeXt添加KANConv卷积(有九种不同类型激活函数,KAN卷积一夜干掉MLP,2024),二次创新CNBlock结构

Kolmogorov-Arnold 网络 (KAN) 是多层感知器 (MLP) 的有前途的替代品。KAN 与 MLP 一样具有强大的数学基础:MLP 基于通用近似定理,而 KAN 基于 Kolmogorov-Arnold 表示定理。KAN 和 MLP 是双重的:KAN 在边缘上具有激活函数,而 MLP 在节点上具有激活函数。KANs与传统 MLPs 在节点(神经元)上使用固定激活函数不同,KANs 在边(权重)上使用可学习的激活函数,权重以 B 样条函数形式表示,每个激活函数可根据输入调整细粒度参数。

2026-03-27 22:43:05 200

原创 ConvNeXt 改进 :ConvNeXt添加SAConv(可切换空洞卷积),自适应融合多尺度特征,优化小目标与遮挡目标感知,二次创新CNBlock结构

空洞卷积(Atrous Convolution)是一种可以在卷积操作中插入“空洞”来扩大感受野的技术,更有效地捕捉到图像中的大范围上下文信息。可切换空洞卷积(SAC)则通过自适应地切换不同的空洞率,使得模型能够灵活地根据特定场景调整卷积的感受野,从而更好地处理不同大小的目标。

2026-03-27 21:54:14 144

原创 ConvNeXt 改进 :ConvNeXt添加LDConv(线性可变形卷积),二次创新CNBlock结构 ,独家创新

LDConv(线性可变形卷积)旨在克服标准卷积和可变形卷积的限制。标准卷积使用固定的采样位置,只能提取局部信息,而可变形卷积通过学习偏移量来调整采样网格,但它们仍然使用规则的采样网格。LDConv通过生成初始采样坐标,并根据偏移量调整采样形状,实现任意大小卷积核的特征提取。根据卷积核参数数量 num_param,计算基数 base_int。使用 torch.meshgrid 函数生成规则卷积核的采样坐标。对规则卷积核的采样坐标进行展平处理。

2026-03-26 21:32:37 169

原创 实验结果与分析篇 | 本科/硕士必备,一文搞定实验结果与分析部分!基于改进 ConvNeXt 的农作物病虫害识别系统

本科做一下对比实验即可(与现有方法对比 + 一个改进模型对比基本欧克了 + 系统设计与实现),硕博发表论文需要做更多(融合模块改进 + 对比实验 + 消融实验 + 模型剪枝/蒸馏 + 冲击 1 区 2区需要自研模块 + 系统设计与实现等)基于ResNet + LLM大语言模型的分类识别系统设计与实现,Web前后端分离,Django+vue3+AI助手模块+ResNet50算法+LLM 联动+Element Plus等技术,全网独发。

2026-03-26 18:28:12 486

原创 ConvNeXt 改进 :ConvNeXt添加SCConv(空间和通道重构卷积,CVPR 2023),实现高效涨点,二次创新CNBlock结构 ,独家首发

积神经网络 (CNN) 在各种计算机视觉任务中取得了卓越的表现,但这是以巨大的计算资源为代价的,部分原因是卷积层提取了冗余特征。最近的研究要么压缩训练有素的大规模模型,要么探索精心设计的轻量级模型。在本文中,我们尝试利用特征之间的空间和通道冗余进行 CNN 压缩,并提出一种高效的卷积模块,称为 SCConv(空间和通道重构卷积),以减少冗余计算并促进代表性特征学习。提出的 SCConv 由两个单元组成:空间重构单元 (SRU) 和通道重构单元 (CRU)。

2026-03-25 21:29:36 143

原创 画图篇 | 一文带你画深度学习模型Grad-CAM热力图、模型对比图、类别分布图、混淆矩阵图,科研/本科论文必备(含Grad-CAM热力图、类别分布图、对比图、混淆矩阵)

因为在这一层,网络经过了最深度的特征提取,具备了最强的高级语义理解能力;同时,它的特征图依然保持着二维的空间维度(比如。

2026-03-25 18:27:09 389

原创 ConvNeXt 改进 :ConvNeXt添加MLCA注意力机制(混合局部信道注意机制,EAAI 2023,中科院 2 区),二次创新CNBlock结构 ,实现涨点,独家首发

轻量化注意力机制 MLCA(Multi-Level Coordinate Attention)。针对传统坐标注意力(CA)在提取空间信息时容易忽略局部细节以及多尺度特征表达不足的问题,MLCA 提出了一种多级信息融合策略。它不仅继承了 CA 能够捕捉长程依赖和精确位置信息的优势,还通过在不同粒度级别上对通道和空间信息进行建模,增强了模型对局部显著区域的感知能力。

2026-03-24 16:56:04 122

原创 ConvNeXt 改进 :ConvNeXt添加LSKA注意机制(大核可分离注意力机制,WACV 2024),二次创新CNBlock结构 ,独家首发

大核注意力(LKA)模块的视觉注意力网络(VAN)在多种基于视觉的任务上表现出卓越的性能,超越了视觉变换器(ViTs)。然而,这些LKA模块中的深度卷积层随着卷积核大小的增加,计算量和内存占用呈二次增长。为了缓解这些问题,并实现在VAN的注意力模块中使用极大的卷积核,我们提出了一系列名为LSKA的大可分离核注意力模块。LSKA将深度卷积层的二维卷积核分解为级联的水平和垂直一维核。与标准LKA设计不同,所提出的分解方法使得注意力模块可以直接使用大核的深度卷积层,而无需任何额外的块。

2026-03-24 16:29:28 119

原创 ConvNeXt 改进 :ConvNeXt添加iRMB注意力机制(反向残差注意力),二次创新CNBlock结构 ,实现涨点,独家首发

本文集中于开发用于密集预测的现代、高效、轻量级模型,同时在参数、FLOPs 和性能之间进行权衡。反向残差块(IRB)是轻量级CNN的基础结构,但在基于注意力的研究中没有得到相应的重视。本文从统一的角度重新思考了轻量级基础结构,结合了高效的 IRB 和 Transformer 的有效组件,将基于 CNN 的 IRB 扩展到基于注意力的模型,并抽象出一个用于轻量级模型设计的单残差Meta Mobile Block(MMB)。

2026-03-23 21:43:18 185

原创 ConvNeXt 改进 :ConvNeXt添加DLKA-Attention可变形大核注意机制(CVPR 2024),二次创新CNBlock结构 ,实现涨点

引入可变形大核注意力 (D-LKA Attention) 的新方法来增强医学图像分割。这种方法使用大型卷积内核有效地捕获体积上下文,避免了过多的计算需求。D-LKA Attention 还受益于可变形卷积,以适应不同的数据模式。大核卷积(Large Kernel Convolution):大核卷积通过使用更大的卷积核来捕捉更广泛的上下文信息。与传统的卷积操作相比,它能在相同的感受野下减少参数量,降低计算复杂度。该方法能够在保持较低计算开销的情况下实现全局信息的聚合。

2026-03-23 17:28:03 111

原创 ConvNeXt 改进 :ConvNeXt添加HAttention注意机制用于图像修复的混合注意力转换器(CVPR 2023),超分辨率重建,二次创新CNBlock结构 ,独家首发

基于Transformer的方法在低层视觉任务中表现出色,例如图像超分辨率。然而,作者通过归因分析发现,这些网络只能利用有限的空间范围的输入信息。这意味着现有网络尚未充分发挥Transformer的潜力。为了激活更多的输入像素以获得更好的重建效果,作者提出了一种新型的混合注意力(HAT)。将 HAttention 机制融入 ConvNeXt 主要为了提升图像清晰度的效果,提高模型识别效果。

2026-03-21 23:51:20 154

原创 ConvNeXt 改进 :一文带你ConvNeXt添加CBAM、SE、CA、GAM、EMA、ECA、DA注意力机制,二次创新CNBlock结构 ,实现涨点,独家首发

ConvNeXt 改进 :一文带你ConvNeXt添加CBAM、SE、CA、GAM、EMA、ECA、DA注意力机制,二次创新CNBlock结构 ,实现涨点,独家首发

2026-03-21 16:38:47 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除