自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 资源 (1)
  • 收藏
  • 关注

原创 PeLK:通过周边卷积的参数高效大型卷积神经网络

提出了一种类似人类的周边卷积human-like peripheral convolution,通过参数共享有效地减少了密集网格卷积的90%以上的参数量,并成功地将内核尺寸扩展到非常大。周边卷积行为类似于人类,将卷积的复杂度从$O(K^{2})$降低到$O(log K)$,而不会牺牲性能。在此基础上,作者提出了参数高效的大型内核网络(PeLK)。提出的PeLK在ImageNet分类、ADE20K语义分割和MS COCO目标检测等各种视觉任务上超越了现代视觉Transformer和卷积神经网络架构,如Swin

2024-04-22 22:53:27 506

原创 YOLO-World: Real-Time Open-Vocabulary Object Detection

引入了YOLO-World,这是一款尖端的开放词汇对象检测器,适用于实际应用,具有高效率。提出了一个可重新参数化的视觉-语言PAN来连接视觉和语言特征,以及一个用于 YOLO-World 的开放词汇区域-文本对比预训练方案。在大规模数据集上预训练的 YOLO-World 表现出强大的**零样本性能**,并在 LVIS 上以 52.0FPS 实现 35.4AP。预训练的 YOLO-World 可以很容易地适应下游任务,例如开放词汇实例分割和引用对象检测。

2024-04-22 22:32:56 437

原创 VM-UNet: Vision Mamba UNet for Medical Image Segmentation

VM-UNet:基于视觉Mamba UNet架构的医学图像分割

2024-04-09 20:47:11 864

原创 【CNN】ConvMixer探究ViT的Patch Embedding: Patches Are All You Need?

文中探究Patch Embedding在ViT上的作用,CNN是否可用该操作提升性能?

2024-04-06 13:45:44 1028

原创 【CNN】RepLKNet: Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs

提升至31x31的内核:重新审视现代卷积神经网络(CNN)中的大型内核设计

2024-04-06 13:30:31 937

原创 VMamba: Visual State Space Model

VMamba:视觉状态空间模型

2024-04-04 23:23:35 948

原创 【图像分割轻量化】 A DECODING SCHEME WITH SUCCESSIVE AGGREGATION OF MULTI-LEVEL FEATURES (SASFormer)

一种基于多级特征逐步聚合的轻量级语义分割解码方案——层级视觉应用于轻量级语义分割

2024-04-04 10:17:20 1017

原创 Vision Mamba 双向状态空间模型下的高效视觉表示学习

Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model 双向状态空间模型下的高效视觉表示学习

2024-03-30 21:01:11 985

原创 【超分轻量化】Fully 1 × 1 Convolutional Network for Lightweight Image Super-Resolution (SCNet)

文中提出了一种简单而有效的**全$1 \times 1$卷积网络**,名为**Shift-Conv-based Network(SCNet)**。通过结合一个**无参数**的空间位移操作,使全$1 \times 1$卷积网络具备了强大的表示能力。

2024-03-27 23:21:02 870

原创 【ViT系列】更加符合视觉感知 TransNeXt: Robust Foveal Visual Perception for Vision Transformers

TransNeXt提出了一种基于仿生中央视觉设计的Token Mixer,即聚合注意力,以及一种带有门控通道注意力的通道混合器,即卷积GLU。将它们结合起来提出了一种强大且高度稳健的视觉模型TransNeXt,该模型在分类、检测和分割等各种视觉任务中实现了最先进的性能。TransNeXt在多尺度推断中的出色表现突显了其在解决深度退化问题方面相对于大内核策略的优势。

2024-03-23 22:56:22 1241

原创 【CNN轻量化】ParameterNet: Parameters Are All You Need 参数就是你所需要的

本文旨在增加大规模视觉预训练模型中的参数数量,同时最大限度地减少FLOPs的增加。利用动态卷积额外的参数引入网络中,而仅仅带来了FLOPs的轻微增加。ParameterNet方法使得低FLOPs网络能够充分利用大规模视觉预训练。

2024-03-20 22:07:06 988

原创 【CNN轻量化】RepViT: Revisiting Mobile CNN From ViT Perspective

探究了许多轻量级ViTs和轻量级CNNs之间的结构联系。文中从ViT的视角重新审视轻量级CNNs的高效设计,并强调它们在移动设备上的前景。具体而言,通过整合轻量级ViTs的高效架构设计,逐步增强了标准轻量级CNN,最终形成了一系列全新的纯轻量级CNNs,即RepViT。大量实验证明,RepViT优于现有的轻量级ViTs,并在各种视觉任务中表现出有利的延迟。值得注意的是,在ImageNet上,**RepViT在iPhone 12上以1.0毫秒的延迟实现了超过80%的top-1准确率**,这是轻量级模型首次实现

2024-03-19 00:13:58 1354

原创 最全NVIDIA Jetson开发板参数配置和购买指南

NVIDIA开发的GPU不仅在电脑显卡领域占据大量份额,在嵌入式NVIDIA的Jeston系列开发板也近乎是领先的存在,特别是NVIDIA Jeston系列开发板在算力和成本的平衡上都要优于其他厂家,性价比很高,设备体积小。本博文旨在给采购NVIDIA Jeston开发板的读者提供一些参数分析和指南。

2024-03-10 12:53:11 1604 4

原创 Sora技术原理浅析

Sora:最大支持生成60秒的连续高清视频场景,基于已有的短视频的前后向扩展,并保持人物的高度一致性。

2024-03-01 00:44:50 917

原创 YOLOv9最全使用教程与部署

yolov9使用指南

2024-02-25 00:17:13 6596 14

原创 【Python报错】urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify

【Python报错】urllib.error.URLError:

2023-12-30 16:10:18 454

原创 【MLP多层感知机】ONNX模型部署(Python&C++)

【代码】【MLP】ONNX模型部署。

2023-12-27 00:08:21 467

原创 【目标检测】TinyDet: Accurate Small Object Detection in Lightweight Generic Detectors

小目标检测新方法TinyDet

2023-12-18 23:31:58 990

原创 【onnxruntime推理】LSTM时序预测模型(含多输入)C++部署(CMake编译)

本文主要介绍在linux开发环境中如何使用C++和Cmake对LSTM进行部署推理。之所以不在vscode等编译软件上直接进行设置,是因为笔者认为CMake更好,可以编辑对应的语法,也可以避免路径设置(CMake直接传入指定路径)等相关问题。

2023-12-07 22:36:11 675

原创 Pytorch实现Warm_up学习率调整

Warm up是在ResNet上提出的一种调整学习率的方法,文中认为学习率在初始的时候不应该过大,应该渐进式地增加到初始学习率,这样有利于模型的训练和泛化能力的提升。

2023-12-05 22:59:50 661

原创 【图像超分】Self-feature Learning: An Efficient Deep Lightweight Network for Image Super-resolution(单图超分)

扩展involution卷积核,提出局部自适应involution核(locally adaptive involution, LA-involution)用于轻量级超分辨率图像网络的构建。

2023-12-03 17:17:39 951 1

原创 【长尾学习】Class-Balanced Loss Based on Effective Number of Samples

从数据的有效样本数进行平衡损失函数设计来解决长尾学习问题

2023-12-03 16:43:43 935 1

原创 LLM之调用智谱API实现问答

LLM之调用智谱API实现问答

2023-11-18 23:48:16 2808 2

原创 模型压缩之模型低比特量化

模型压缩之模型低比特量化

2023-11-17 22:56:00 195

原创 长尾学习笔记(一)

长尾学习方法笔记(一)

2023-11-04 16:09:48 99 1

原创 [Pytorch教程]之将经过transforms的张量还原为图像

在实验过程中,需要将经过变换后的图像还原回实际的RGB图进行可视化。

2023-07-28 09:29:13 508 3

原创 【保姆级教程】SShfs+Winfsp文件挂载和传输工具使用

SShfs是一款将局域网电脑中的文件挂载到本地磁盘某一位置的软件,支持输出传输,性能稳定,可靠。

2023-06-26 10:52:09 2349 1

原创 【lite.ai.toolkit】Onnxruntime保姆级教程

最近在Github看到了一个新的部署库lite.ai.toolkit,本博客主要介绍编译测试lite.ai.toolkit的过程。

2023-05-30 18:29:10 1215 1

原创 【Mxnet2onnx模型报错】GEMM: Dimension mismatch

【Mxnet2onnx模型报错】GEMM: Dimension mismatch

2023-05-25 11:39:52 450

原创 CV-CUDA之编译与使用

CV-CUDA之编译与使用,CV-CUDA是NVIDIA和字节联合开发的GPU前后端处理加速库,该库能实现将图像、视频的预处理和后处理都加载到GPU上进行处理,大幅提高模型推理能力,缺点就是需要更多一点的显存占用。

2023-04-12 23:35:13 999 4

原创 CV-CUDA之依赖环境安装

CV-CUDA之依赖环境安装,CV-CUDA是NVIDIA和字节联合开发的GPU前后端处理加速库,该库能实现将图像、视频的预处理和后处理都加载到GPU上进行处理,大幅提高模型推理能力,缺点就是需要更多一点的显存占用。

2023-04-12 23:30:43 1273

原创 YOLOv5 MNN框架C++推理

YOLOv5 MNN框架C++推理:MNN是阿里提出的深度网络加速框架,是一个轻量级的深度神经网络引擎,集成了大量的优化算子,支持深度学习的推理与训练。据说比腾讯开发的NCNN框架好一些。本文主要使用MNN对yolov5s模型进行推理加速。

2023-04-11 10:07:18 1059 8

原创 CV-CUDA NVIDIA GPU前后处理库入门

CV-CUDA是NVIDIA开发出的一个用于图像预处理的库,将大部分的预处理和后处理都迁移到GPU上进行,提高对输入输出图像的处理效率,目前该库才刚开源不久,本文使用的是v0.2.1这个版本。

2023-04-10 09:47:46 1295

原创 全局平均池化(Global average pooling, GAP)

全局平均池化(Global average pooling, GAP)

2023-03-01 09:55:50 2339

原创 YOLOv5 实践之PCB缺陷检测

YOLO模型思想简述:YOLO (You Only Look Once) 是属于目标检测中的“one-stage”方法。

2022-11-14 15:22:49 1849 4

原创 PyTorch 加载预训练权重

PyTorch 加载预训练权重

2022-10-08 16:19:57 5164

原创 Python指定使用gpu

单/多卡GPU使用设置

2022-08-05 09:48:17 13726

原创 MATLAB初始化数据方法汇总

1. randi():产生均匀分布的伪随机数(整数)Examples:% 产生满足1-10之间均匀分布的3*5随机矩阵a1 = randi(10, 3, 5);% 产生满足-5-5之间均匀分布的2*10随机矩阵a1 = randi([-5, 5], 2, 10);2. rand():产生均匀分布的伪随机数Examples:% 产生满足[0, 1]均匀分布的4*5随机矩阵a2 = rand(4, 5);% 产生满足[a, b]均匀分布的2*5随机矩阵(常用)a2 = a+(b-a)

2021-07-13 18:43:45 4035

转载 思维导图之AI最全学习路线

思维导图之AI最全学习路线转载知乎链接: https://zhuanlan.zhihu.com/p/64052743.结合推文,将各个分支结合起来,构建一个全面的知识网络,供初入AI领域的程序员参考#接下来就直接上传图思维导图未来计划上传MindMaster版带网页链接的思维导图,尽情期待!!!!引用链接: https://zhuanlan.zhihu.com/p/6405274...

2019-11-22 17:20:40 934

adurino和树莓派Python使用IIC通讯通过ADS1x15读取模拟信号

Adafruit_Python_ADS1x15项目源代码,可用于adurino和树莓派(raspberry pi)和 NVIDIA Jetson开发板

2024-03-10

AI网络结构.jpeg

这是一个人工智能的知识学习思维导图,该思维导图结合了知乎大佬的帖子,我将他分块的可视化整合起来,方便对AI领域感兴趣的程序员、学生、教育人员观看学习和参考。

2019-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除