- 博客(39)
- 资源 (1)
- 收藏
- 关注
原创 PeLK:通过周边卷积的参数高效大型卷积神经网络
提出了一种类似人类的周边卷积human-like peripheral convolution,通过参数共享有效地减少了密集网格卷积的90%以上的参数量,并成功地将内核尺寸扩展到非常大。周边卷积行为类似于人类,将卷积的复杂度从$O(K^{2})$降低到$O(log K)$,而不会牺牲性能。在此基础上,作者提出了参数高效的大型内核网络(PeLK)。提出的PeLK在ImageNet分类、ADE20K语义分割和MS COCO目标检测等各种视觉任务上超越了现代视觉Transformer和卷积神经网络架构,如Swin
2024-04-22 22:53:27 506
原创 YOLO-World: Real-Time Open-Vocabulary Object Detection
引入了YOLO-World,这是一款尖端的开放词汇对象检测器,适用于实际应用,具有高效率。提出了一个可重新参数化的视觉-语言PAN来连接视觉和语言特征,以及一个用于 YOLO-World 的开放词汇区域-文本对比预训练方案。在大规模数据集上预训练的 YOLO-World 表现出强大的**零样本性能**,并在 LVIS 上以 52.0FPS 实现 35.4AP。预训练的 YOLO-World 可以很容易地适应下游任务,例如开放词汇实例分割和引用对象检测。
2024-04-22 22:32:56 437
原创 VM-UNet: Vision Mamba UNet for Medical Image Segmentation
VM-UNet:基于视觉Mamba UNet架构的医学图像分割
2024-04-09 20:47:11 864
原创 【CNN】ConvMixer探究ViT的Patch Embedding: Patches Are All You Need?
文中探究Patch Embedding在ViT上的作用,CNN是否可用该操作提升性能?
2024-04-06 13:45:44 1028
原创 【CNN】RepLKNet: Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs
提升至31x31的内核:重新审视现代卷积神经网络(CNN)中的大型内核设计
2024-04-06 13:30:31 937
原创 【图像分割轻量化】 A DECODING SCHEME WITH SUCCESSIVE AGGREGATION OF MULTI-LEVEL FEATURES (SASFormer)
一种基于多级特征逐步聚合的轻量级语义分割解码方案——层级视觉应用于轻量级语义分割
2024-04-04 10:17:20 1017
原创 Vision Mamba 双向状态空间模型下的高效视觉表示学习
Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model 双向状态空间模型下的高效视觉表示学习
2024-03-30 21:01:11 985
原创 【超分轻量化】Fully 1 × 1 Convolutional Network for Lightweight Image Super-Resolution (SCNet)
文中提出了一种简单而有效的**全$1 \times 1$卷积网络**,名为**Shift-Conv-based Network(SCNet)**。通过结合一个**无参数**的空间位移操作,使全$1 \times 1$卷积网络具备了强大的表示能力。
2024-03-27 23:21:02 870
原创 【ViT系列】更加符合视觉感知 TransNeXt: Robust Foveal Visual Perception for Vision Transformers
TransNeXt提出了一种基于仿生中央视觉设计的Token Mixer,即聚合注意力,以及一种带有门控通道注意力的通道混合器,即卷积GLU。将它们结合起来提出了一种强大且高度稳健的视觉模型TransNeXt,该模型在分类、检测和分割等各种视觉任务中实现了最先进的性能。TransNeXt在多尺度推断中的出色表现突显了其在解决深度退化问题方面相对于大内核策略的优势。
2024-03-23 22:56:22 1241
原创 【CNN轻量化】ParameterNet: Parameters Are All You Need 参数就是你所需要的
本文旨在增加大规模视觉预训练模型中的参数数量,同时最大限度地减少FLOPs的增加。利用动态卷积额外的参数引入网络中,而仅仅带来了FLOPs的轻微增加。ParameterNet方法使得低FLOPs网络能够充分利用大规模视觉预训练。
2024-03-20 22:07:06 988
原创 【CNN轻量化】RepViT: Revisiting Mobile CNN From ViT Perspective
探究了许多轻量级ViTs和轻量级CNNs之间的结构联系。文中从ViT的视角重新审视轻量级CNNs的高效设计,并强调它们在移动设备上的前景。具体而言,通过整合轻量级ViTs的高效架构设计,逐步增强了标准轻量级CNN,最终形成了一系列全新的纯轻量级CNNs,即RepViT。大量实验证明,RepViT优于现有的轻量级ViTs,并在各种视觉任务中表现出有利的延迟。值得注意的是,在ImageNet上,**RepViT在iPhone 12上以1.0毫秒的延迟实现了超过80%的top-1准确率**,这是轻量级模型首次实现
2024-03-19 00:13:58 1354
原创 最全NVIDIA Jetson开发板参数配置和购买指南
NVIDIA开发的GPU不仅在电脑显卡领域占据大量份额,在嵌入式NVIDIA的Jeston系列开发板也近乎是领先的存在,特别是NVIDIA Jeston系列开发板在算力和成本的平衡上都要优于其他厂家,性价比很高,设备体积小。本博文旨在给采购NVIDIA Jeston开发板的读者提供一些参数分析和指南。
2024-03-10 12:53:11 1604 4
原创 【Python报错】urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify
【Python报错】urllib.error.URLError:
2023-12-30 16:10:18 454
原创 【目标检测】TinyDet: Accurate Small Object Detection in Lightweight Generic Detectors
小目标检测新方法TinyDet
2023-12-18 23:31:58 990
原创 【onnxruntime推理】LSTM时序预测模型(含多输入)C++部署(CMake编译)
本文主要介绍在linux开发环境中如何使用C++和Cmake对LSTM进行部署推理。之所以不在vscode等编译软件上直接进行设置,是因为笔者认为CMake更好,可以编辑对应的语法,也可以避免路径设置(CMake直接传入指定路径)等相关问题。
2023-12-07 22:36:11 675
原创 Pytorch实现Warm_up学习率调整
Warm up是在ResNet上提出的一种调整学习率的方法,文中认为学习率在初始的时候不应该过大,应该渐进式地增加到初始学习率,这样有利于模型的训练和泛化能力的提升。
2023-12-05 22:59:50 661
原创 【图像超分】Self-feature Learning: An Efficient Deep Lightweight Network for Image Super-resolution(单图超分)
扩展involution卷积核,提出局部自适应involution核(locally adaptive involution, LA-involution)用于轻量级超分辨率图像网络的构建。
2023-12-03 17:17:39 951 1
原创 【长尾学习】Class-Balanced Loss Based on Effective Number of Samples
从数据的有效样本数进行平衡损失函数设计来解决长尾学习问题
2023-12-03 16:43:43 935 1
原创 【保姆级教程】SShfs+Winfsp文件挂载和传输工具使用
SShfs是一款将局域网电脑中的文件挂载到本地磁盘某一位置的软件,支持输出传输,性能稳定,可靠。
2023-06-26 10:52:09 2349 1
原创 【lite.ai.toolkit】Onnxruntime保姆级教程
最近在Github看到了一个新的部署库lite.ai.toolkit,本博客主要介绍编译测试lite.ai.toolkit的过程。
2023-05-30 18:29:10 1215 1
原创 【Mxnet2onnx模型报错】GEMM: Dimension mismatch
【Mxnet2onnx模型报错】GEMM: Dimension mismatch
2023-05-25 11:39:52 450
原创 CV-CUDA之编译与使用
CV-CUDA之编译与使用,CV-CUDA是NVIDIA和字节联合开发的GPU前后端处理加速库,该库能实现将图像、视频的预处理和后处理都加载到GPU上进行处理,大幅提高模型推理能力,缺点就是需要更多一点的显存占用。
2023-04-12 23:35:13 999 4
原创 CV-CUDA之依赖环境安装
CV-CUDA之依赖环境安装,CV-CUDA是NVIDIA和字节联合开发的GPU前后端处理加速库,该库能实现将图像、视频的预处理和后处理都加载到GPU上进行处理,大幅提高模型推理能力,缺点就是需要更多一点的显存占用。
2023-04-12 23:30:43 1273
原创 YOLOv5 MNN框架C++推理
YOLOv5 MNN框架C++推理:MNN是阿里提出的深度网络加速框架,是一个轻量级的深度神经网络引擎,集成了大量的优化算子,支持深度学习的推理与训练。据说比腾讯开发的NCNN框架好一些。本文主要使用MNN对yolov5s模型进行推理加速。
2023-04-11 10:07:18 1059 8
原创 CV-CUDA NVIDIA GPU前后处理库入门
CV-CUDA是NVIDIA开发出的一个用于图像预处理的库,将大部分的预处理和后处理都迁移到GPU上进行,提高对输入输出图像的处理效率,目前该库才刚开源不久,本文使用的是v0.2.1这个版本。
2023-04-10 09:47:46 1295
原创 YOLOv5 实践之PCB缺陷检测
YOLO模型思想简述:YOLO (You Only Look Once) 是属于目标检测中的“one-stage”方法。
2022-11-14 15:22:49 1849 4
原创 MATLAB初始化数据方法汇总
1. randi():产生均匀分布的伪随机数(整数)Examples:% 产生满足1-10之间均匀分布的3*5随机矩阵a1 = randi(10, 3, 5);% 产生满足-5-5之间均匀分布的2*10随机矩阵a1 = randi([-5, 5], 2, 10);2. rand():产生均匀分布的伪随机数Examples:% 产生满足[0, 1]均匀分布的4*5随机矩阵a2 = rand(4, 5);% 产生满足[a, b]均匀分布的2*5随机矩阵(常用)a2 = a+(b-a)
2021-07-13 18:43:45 4035
转载 思维导图之AI最全学习路线
思维导图之AI最全学习路线转载知乎链接: https://zhuanlan.zhihu.com/p/64052743.结合推文,将各个分支结合起来,构建一个全面的知识网络,供初入AI领域的程序员参考#接下来就直接上传图思维导图未来计划上传MindMaster版带网页链接的思维导图,尽情期待!!!!引用链接: https://zhuanlan.zhihu.com/p/6405274...
2019-11-22 17:20:40 934
adurino和树莓派Python使用IIC通讯通过ADS1x15读取模拟信号
2024-03-10
AI网络结构.jpeg
2019-11-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人