自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(140)
  • 资源 (3)
  • 收藏
  • 关注

原创 Pytorch DataLoader 提高模型训练时的 Volatile Gpu-Util(GPU利用率)

Pytorch DataLoader 函数,提高模型训练时的 GPU利用率 Volatile Gpu-Util

2024-03-19 15:37:20 783

原创 模型评估指标详解:ROC 曲线和 AUC 的计算方法

机器学习模型评估指标详解:ROC 曲线和 AUC 的计算方法,AUC 的物理意义,根据物理意义计算 AUC

2024-01-21 14:09:27 1731

原创 PP-OCR 论文解读:百度 PaddleOCR 通用中英文 3.5M 超轻量 OCR 模型

Paddle OCR 论文《PP-OCR: A Practical Ultra Lightweight OCR System》

2024-01-03 10:14:25 1214

原创 小白综述:深度学习 OCR 图片文字识别

深度学习 OCR 图片文字识别简述

2024-01-03 10:13:10 2976

原创 安装 labelme 报错:urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the ‘ssl‘ module is OpenSSL 1.1.0

安装 labelme 报错:ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the 'ssl' module is compiled with 'OpenSSL 1.1.0i 14 Aug 2018'. See: https://github.com/urllib3/urllib3/issues/2168

2023-11-29 19:57:06 754

原创 Dif-Fusion:第一个基于扩散模型实现的红外光与可见光图像融合的论文

第一个基于扩散模型实现的红外光与可见光图像融合的论文。Dif-Fusion: Towards High Color Fidelity in Infrared and Visible Image Fusion with Diffusion Models

2023-11-14 14:47:24 1463 8

原创 FusionDiff:第一个基于扩散模型实现的多聚焦图像融合的论文

FusionDiff:第一个基于扩散模型实现的多聚焦图像融合的论文。FusionDiff: Multi-focus image fusion using denoising diffusion probabilistic models

2023-11-14 10:29:36 1233 5

原创 深度学习中的数据类型介绍:FP32, FP16, TF32, BF16, Int16, Int8 ...

深度学习中的数据类型介绍:FP32, FP16, TF32, BF16, Int16, Int8 ...

2023-11-06 11:01:57 8480

原创 多聚焦图像融合资料汇总:论文,代码,数据集,评价指标

多聚焦图像融合资料汇总:论文,代码,数据集,评价指标

2023-10-31 17:30:07 1713 4

原创 【目标跟踪】ECO算法论文阅读:ECO: Efficient Convolution Operators for Tracking

这里所指的训练集是指保存了每一帧的跟踪结果的训练集,也就是说,每一次进行model update的时候,要用在这一帧之前所有跟踪到的样本。那么随着视频越来越长,这个训练集就会越来越大。因为当目标被遮挡或者丢失的时候,比较新的这些样本本身就是错的,那么模型很容易有model drift,就是被背景或者错误的目标污染,导致跟踪结果出错。如下图所示,Baseline是传统的训练集,每更新一帧就加一个进来,那么连续的数帧后训练集里面的样本都是高度相似的,即容易遗忘前面的样本,且容易对最近的若干帧样本过拟合。

2023-10-25 14:36:48 566

原创 计算二叉树中最后一层的叶子节点的个数:层序遍历

计算二叉树中最后一层的叶子节点的个数

2023-09-22 22:00:17 259

原创 解决中国科大 USTC 邮箱系统的超大附件上传的邮箱控件安装问题

解决中国科大 USTC 邮箱系统的超大附件上传的邮箱控件安装问题

2023-09-16 23:04:56 905

原创 【AutoML--模型搜索】论文阅读:Once-for-All: Train One Network and Specialize it for Efficient Deployment

论文阅读笔记:Once-for-All: Train One Network and Specialize it for Efficient Deployment

2023-09-05 18:28:29 125

原创 NMS(非极大值抑制)的 Python 实现

NMS(非极大值抑制)的 Python 实现

2023-08-30 13:08:40 1625

原创 AIGC书籍推荐:《生成式深度学习的数学原理》

AIGC书籍推荐:《生成式深度学习的数学原理》。本书对当前主流的三大深度生成模型(变分自编码器 VAE,生成对抗网络 GAN,扩散模型 Diffusion Models)的数学原理进行了详细推导,旨在帮助读者从原理上深入理解它们。

2023-07-25 14:39:55 1114

原创 数据结构与算法:top K 问题

top K 问题是面试中常考的问题,往往可以用排序(排序)和堆(大/小根堆)来解决

2023-07-16 20:05:38 319

原创 OpenCv (C++) 使用矩形 Rect 覆盖图像中某个区域

OpenCv (C++) 使用矩形 Rect 覆盖图像中某个区域

2023-07-14 11:30:18 2509

原创 Python bisect库的用法:用于有序序列的插入和非逆序系列的二分查找

Python bisect库的用法:用于有序序列的插入和非逆序系列的二分查找

2023-07-09 20:29:28 645 1

原创 【PyTorch API】 nn.RNN 和 nn.LSTM 介绍和代码详解

PyTorch API 之 nn.RNN 和 nn.LSTM 介绍和代码详解

2023-07-06 15:09:21 3514

原创 C++ 虚函数 (virtual function) 介绍

C++ 虚函数和纯虚函数介绍

2023-06-29 17:05:04 4344

原创 GPU 并行计算入门

介绍 CPU 和 GPU 的架构的联系和区别,CUDA 并行计算的简单介绍

2023-06-14 23:16:58 2695

原创 一文彻底搞懂 Softmax 函数,数学原理分析和 PyTorch 验证

Softmax 函数的数学原理分析和 PyTorch 使用

2023-06-14 15:46:24 14047 1

原创 C++ 使用一维数组和二维数组给 std::vector<cv::Point2d> 赋值的方法

C++ 使用一维数组和二维数组给 std::vector 赋值的方法

2023-06-08 16:58:57 2095

原创 Bilinear CNN:细粒度图像分类网络,对Bilinear CNN中矩阵外积的解释。

Bilinear CNN:细粒度图像分类网络。

2023-06-07 19:55:22 1373

原创 DPCNN:深度金字塔 CNN 文本分类网络

DPCNN(Deep Pyramid CNN),是2017年腾讯AI-Lab提出的一种用于文本分类的网络,可以称之为"深度金字塔卷积神经网络"。

2023-06-02 10:10:59 725

原创 TextCNN:用于文本分类的CNN网络

TextCNN 是2014年提出的用于文本分类的CNN网络

2023-06-02 00:19:32 598

原创 C++ 使用范围 for 语句修改数组元素为什么要使用引用

C++ 使用范围 for 语句修改数组元素必须要使用引用,不可以使用赋值。并且使用引用时程序的执行效率更高。

2023-02-28 19:45:39 897

原创 CTC Loss 数学原理讲解:Connectionist Temporal Classification

CTC Loss 是一种不需要数据对齐的,广泛用于图像文本识别和语音识别任务的损失函数。

2023-02-27 16:43:08 3204

原创 PyTorch 反向传播报错:one of the variables needed for gradient computation has been modified by an inplace

PyTorch 反向传播报错:RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [12, 128, 64, 64]], which is output 0 of ReluBackward0, is at version 1; expected version 0 instead. Hint:

2023-02-16 19:59:12 3086

原创 工程经验:残差连接对网络训练的巨大影响

所以参数没有更新的原因极有可能是梯度为0,即出现了 “梯度消失” 的现象。事实上,SegNet 有 20个卷积层和10个上/下采样层,总共有30层。这是一个层数比较多的网络,因此出现梯度消失是很正常的。从模型训练的本质上来看,loss 值固定就表示模型参数没有变化,即参数没有更新。为了解决 “梯度消失” 的问题,我们自然能想到使用残差连接,这是解决梯度消失最有效的方法之一。可以看到,loss 值快速下降到一个固定值就不再下降了。可以明显看到,仅仅加了几个残差连接,网络就可以顺利地训练了。

2023-02-13 20:28:47 613

原创 PyTorch 的 Pooling 和 UnPooling函数中的 indices 参数:nn.MaxPool2d/nn.MaxUnpool2d、F.max_pool2d/F.max_unpool2d

这篇博文主要介绍 PyTorch 的 MaxPooling 和 MAxUnPooling 函数中涉及到的 indices 参数。indices 是“索引”的意思,对于一些结构对称的网络模型,上采样和下采样的结构往往是对称的,我们可以在下采样做 MaxPooling 的时候记录下来最大值所在的位置,当做上采样的时候把最大值还原到其对应的位置,然后其余的位置补 0。indices 参数的作用就是保存 MaxPooling 操作时最大值位置的索引。

2023-02-12 20:15:27 3415

原创 pytorch 提取网络中的某一层并冻结其参数

pytorch 提取网络中的某一层并冻结其参数

2022-11-28 19:01:42 1869

原创 torchvision.transforms 数据预处理:Normalize()

在图像预处理中,Normalize() 通常和 ToTensor() 一起使用。

2022-11-10 16:25:39 2502 3

原创 torchvision.transforms 数据预处理:ToTensor()

torchvision.transforms 数据预处理:ToTensor()

2022-11-10 12:33:22 14564 1

原创 C++ 中单引号和双引号的区别

在 python 中,单引号和双引号是等价的,二者没有任何区别。但在C++中,二者是不一样的。单引号是 char 字符类型, 双引号是 string 字符串类型。

2022-10-26 15:00:23 1971

原创 pytorch 实现一个最简单的 GAN:用mnist数据集生成新图像

pytorch 实现一个最简单的 GAN:用mnist数据集生成新图像

2022-09-25 21:17:24 1299

原创 pytorch中tensor的形状 [n,1] 与 [n] 的区别

pytorch中tensor的形状 [n,1] 与 [n] 的区别

2022-09-25 14:32:47 888

原创 【keras入门】使用 keras 训练 MNIST 数据集

使用 keras 训练MNIST数据集

2022-09-21 20:51:53 1209 3

原创 Matlab 离散小波变换函数 dwt2() 原理介绍与实验

图像信号的低频部分(低通带)表示图像的基本信息(平滑信息),而高频部分(高通带)表示图像的细节信息。2、图像中的高频部分一般持续的时间是比较短的,一般是以短时突变或者尖峰的形式出现,如图像的边缘信息和一些噪点信息。而低频信息在大部分地方存在,反应在一些背景或内容信息。

2022-09-06 10:10:26 14819 1

原创 自动编码器(AE)生成Mnist手写数字集,基于tensorflow和keras实现

基于tensorflow和keras实现自动编码器(AE)生成Mnist手写数字集

2022-08-23 11:09:30 1191

【CUDA编程】opencv4 + CUDA 并行图像处理:图像均值滤波和图像反色

一、环境配置与测试 二、cuda与OpenCV结合方法 三、代码实例:图像均值滤波和图像反色 3.1 代码 3.2 代码说明 3.3 网格大小与线程块大小的确定 3.3.1 网格与线程块大小的限制 3.3.2 如何确定网格大小与线程块大小? 3.4 并行与串行的加速比 四、总结

2022-08-12

【FastDup】可以查找重复、相似、异常的图像的python库

一、FastDup 简介 二、安装 FastDup库 三、使用 FastDup 3.1 相似性度量 3.2 测试代码 3.3 测试结果 四、查看 FastDup源码 五、更改 FastDup源码的参数 5.1 源码研读 5.2 如何只查找重复或相似图像 六、FastDup 的算法原理

2022-07-08

C++ Eigen库的下载配置和使用

一、Eigen 介绍 二、Eigen 的下载 三、Eigen 的配置 3.1 在 Qt 下配置 3.2 在 Visual Studio (VS) 下配置 四、Eigen 的使用 4.1 矩阵和向量的初始化 4.2 矩阵元素的赋值 4.3 矩阵元素的访问 4.4 获取矩阵大小 4.5 特殊矩阵的定义 4.5.1 全0矩阵 4.5.2 全1矩阵 4.5.3 矩阵置0 4.5.4 矩阵置1 4.5.5 随机矩阵 4.5.6 置为单位阵(不一定是方阵) 4.5.7 矩阵填充 4.5.8 将向量转为对角阵 4.6 矩阵运算 4.6.1 矩阵相乘 4.6.2 矩阵转置 4.6.3 矩阵求逆 4.6.4 求矩阵的特征值和特征向量 4.6.5 矩阵的SVD分解 4.6.6 计算矩阵的伪逆

2022-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除