- 博客(140)
- 资源 (3)
- 收藏
- 关注
原创 Pytorch DataLoader 提高模型训练时的 Volatile Gpu-Util(GPU利用率)
Pytorch DataLoader 函数,提高模型训练时的 GPU利用率 Volatile Gpu-Util
2024-03-19 15:37:20 783
原创 模型评估指标详解:ROC 曲线和 AUC 的计算方法
机器学习模型评估指标详解:ROC 曲线和 AUC 的计算方法,AUC 的物理意义,根据物理意义计算 AUC
2024-01-21 14:09:27 1731
原创 PP-OCR 论文解读:百度 PaddleOCR 通用中英文 3.5M 超轻量 OCR 模型
Paddle OCR 论文《PP-OCR: A Practical Ultra Lightweight OCR System》
2024-01-03 10:14:25 1214
原创 安装 labelme 报错:urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the ‘ssl‘ module is OpenSSL 1.1.0
安装 labelme 报错:ImportError: urllib3 v2.0 only supports OpenSSL 1.1.1+, currently the 'ssl' module is compiled with 'OpenSSL 1.1.0i 14 Aug 2018'. See: https://github.com/urllib3/urllib3/issues/2168
2023-11-29 19:57:06 754
原创 Dif-Fusion:第一个基于扩散模型实现的红外光与可见光图像融合的论文
第一个基于扩散模型实现的红外光与可见光图像融合的论文。Dif-Fusion: Towards High Color Fidelity in Infrared and Visible Image Fusion with Diffusion Models
2023-11-14 14:47:24 1463 8
原创 FusionDiff:第一个基于扩散模型实现的多聚焦图像融合的论文
FusionDiff:第一个基于扩散模型实现的多聚焦图像融合的论文。FusionDiff: Multi-focus image fusion using denoising diffusion probabilistic models
2023-11-14 10:29:36 1234 5
原创 深度学习中的数据类型介绍:FP32, FP16, TF32, BF16, Int16, Int8 ...
深度学习中的数据类型介绍:FP32, FP16, TF32, BF16, Int16, Int8 ...
2023-11-06 11:01:57 8480
原创 【目标跟踪】ECO算法论文阅读:ECO: Efficient Convolution Operators for Tracking
这里所指的训练集是指保存了每一帧的跟踪结果的训练集,也就是说,每一次进行model update的时候,要用在这一帧之前所有跟踪到的样本。那么随着视频越来越长,这个训练集就会越来越大。因为当目标被遮挡或者丢失的时候,比较新的这些样本本身就是错的,那么模型很容易有model drift,就是被背景或者错误的目标污染,导致跟踪结果出错。如下图所示,Baseline是传统的训练集,每更新一帧就加一个进来,那么连续的数帧后训练集里面的样本都是高度相似的,即容易遗忘前面的样本,且容易对最近的若干帧样本过拟合。
2023-10-25 14:36:48 566
原创 【AutoML--模型搜索】论文阅读:Once-for-All: Train One Network and Specialize it for Efficient Deployment
论文阅读笔记:Once-for-All: Train One Network and Specialize it for Efficient Deployment
2023-09-05 18:28:29 125
原创 AIGC书籍推荐:《生成式深度学习的数学原理》
AIGC书籍推荐:《生成式深度学习的数学原理》。本书对当前主流的三大深度生成模型(变分自编码器 VAE,生成对抗网络 GAN,扩散模型 Diffusion Models)的数学原理进行了详细推导,旨在帮助读者从原理上深入理解它们。
2023-07-25 14:39:55 1114
原创 Python bisect库的用法:用于有序序列的插入和非逆序系列的二分查找
Python bisect库的用法:用于有序序列的插入和非逆序系列的二分查找
2023-07-09 20:29:28 645 1
原创 【PyTorch API】 nn.RNN 和 nn.LSTM 介绍和代码详解
PyTorch API 之 nn.RNN 和 nn.LSTM 介绍和代码详解
2023-07-06 15:09:21 3514
原创 C++ 使用一维数组和二维数组给 std::vector<cv::Point2d> 赋值的方法
C++ 使用一维数组和二维数组给 std::vector 赋值的方法
2023-06-08 16:58:57 2095
原创 DPCNN:深度金字塔 CNN 文本分类网络
DPCNN(Deep Pyramid CNN),是2017年腾讯AI-Lab提出的一种用于文本分类的网络,可以称之为"深度金字塔卷积神经网络"。
2023-06-02 10:10:59 725
原创 C++ 使用范围 for 语句修改数组元素为什么要使用引用
C++ 使用范围 for 语句修改数组元素必须要使用引用,不可以使用赋值。并且使用引用时程序的执行效率更高。
2023-02-28 19:45:39 897
原创 CTC Loss 数学原理讲解:Connectionist Temporal Classification
CTC Loss 是一种不需要数据对齐的,广泛用于图像文本识别和语音识别任务的损失函数。
2023-02-27 16:43:08 3204
原创 PyTorch 反向传播报错:one of the variables needed for gradient computation has been modified by an inplace
PyTorch 反向传播报错:RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [12, 128, 64, 64]], which is output 0 of ReluBackward0, is at version 1; expected version 0 instead. Hint:
2023-02-16 19:59:12 3086
原创 工程经验:残差连接对网络训练的巨大影响
所以参数没有更新的原因极有可能是梯度为0,即出现了 “梯度消失” 的现象。事实上,SegNet 有 20个卷积层和10个上/下采样层,总共有30层。这是一个层数比较多的网络,因此出现梯度消失是很正常的。从模型训练的本质上来看,loss 值固定就表示模型参数没有变化,即参数没有更新。为了解决 “梯度消失” 的问题,我们自然能想到使用残差连接,这是解决梯度消失最有效的方法之一。可以看到,loss 值快速下降到一个固定值就不再下降了。可以明显看到,仅仅加了几个残差连接,网络就可以顺利地训练了。
2023-02-13 20:28:47 613
原创 PyTorch 的 Pooling 和 UnPooling函数中的 indices 参数:nn.MaxPool2d/nn.MaxUnpool2d、F.max_pool2d/F.max_unpool2d
这篇博文主要介绍 PyTorch 的 MaxPooling 和 MAxUnPooling 函数中涉及到的 indices 参数。indices 是“索引”的意思,对于一些结构对称的网络模型,上采样和下采样的结构往往是对称的,我们可以在下采样做 MaxPooling 的时候记录下来最大值所在的位置,当做上采样的时候把最大值还原到其对应的位置,然后其余的位置补 0。indices 参数的作用就是保存 MaxPooling 操作时最大值位置的索引。
2023-02-12 20:15:27 3415
原创 torchvision.transforms 数据预处理:Normalize()
在图像预处理中,Normalize() 通常和 ToTensor() 一起使用。
2022-11-10 16:25:39 2502 3
原创 torchvision.transforms 数据预处理:ToTensor()
torchvision.transforms 数据预处理:ToTensor()
2022-11-10 12:33:22 14564 1
原创 C++ 中单引号和双引号的区别
在 python 中,单引号和双引号是等价的,二者没有任何区别。但在C++中,二者是不一样的。单引号是 char 字符类型, 双引号是 string 字符串类型。
2022-10-26 15:00:23 1971
原创 Matlab 离散小波变换函数 dwt2() 原理介绍与实验
图像信号的低频部分(低通带)表示图像的基本信息(平滑信息),而高频部分(高通带)表示图像的细节信息。2、图像中的高频部分一般持续的时间是比较短的,一般是以短时突变或者尖峰的形式出现,如图像的边缘信息和一些噪点信息。而低频信息在大部分地方存在,反应在一些背景或内容信息。
2022-09-06 10:10:26 14819 1
原创 自动编码器(AE)生成Mnist手写数字集,基于tensorflow和keras实现
基于tensorflow和keras实现自动编码器(AE)生成Mnist手写数字集
2022-08-23 11:09:30 1191
【CUDA编程】opencv4 + CUDA 并行图像处理:图像均值滤波和图像反色
2022-08-12
【FastDup】可以查找重复、相似、异常的图像的python库
2022-07-08
C++ Eigen库的下载配置和使用
2022-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人