咕噜咕噜开心加油-CSDN博客

原创 5.5 Underwater Image Enhancement via Wavelet Decomposition Fusion of Advantage Contrast（WWAC)

虽然CCT操作修改水下图像的全局平均值，确保整体图像外观的一致性，但值得注意的是，这种全局调整有时会导致图像细节的丢失。最后，通过将色彩转换后的水下图像与源图像的细节层相加，得到色彩校正后的输出图像。为了提高图像质量，去除噪声，利用高斯滤波对颜色迁移图像进行平滑处理，减少风格迁移过程中引入的不自然的颜色伪影和细节失真，并保留图像的主要结构和低频信息。在色彩转移中，使用最大衰减图和色彩风格转移来生成一个色彩校正的图像，并将原始退化的图像的细节层混合到色彩转移的图像中。拉伸后的最大为100，最小为0。

2025-05-14 11:18:21 639

原创有关水下图像增强的论文

小尺寸的图像块可能导致局部场景中的辐射过度增强，而大尺寸的图像块容易出现强度不连续的块状伪影，因此自适应图像块尺寸更适合不同大小的图像。基于灰度世界假设的白平衡算法，就是将这一假设强制应用于待处理图像，通过分别计算图像中红、绿、蓝通道的平均值，然后根据每个通道与平均灰度值的差异来计算增益，再将增益应用于图像的每个通道，从而从图像中消除环境光的影响，获得原始场景图像，使白色还原成纯白色，保证在各种光线条件下，成像色彩跟物体真实的色彩保持一致。受局部对比度的启发，采用积分图像快速统计图像局部块的均值。

2025-05-04 21:33:53 1133 1

原创 U-shape_Transformer_for_Underwater_Image_Enhancement的复现

输出为true的话，那就说明安装为GPU的版本啦，然后在安装requirements的时候，发现torch被重新安装了，于是删掉requirements里的torch和torchvision，然后就只能重新再来，最终运行test就可以啦。然后他的运行、测试都需要jupyter notebook，但我不是专业版本的，然后查了半天也没搞清楚怎么弄，后来就把这个代码直接复制粘贴到py文件里。因为我是直接测试，而不是使用，因此，我选择训练，提前下载好预训练模型，作者在代码中提供放入saved_models。

2025-04-07 11:40:49 231

原创 4.1论文阅读

一：PhDnet：一种用于遥感图像的新型物理感知去雾网络一：PhDnet：一种用于遥感图像的新型物理感知去雾网络。

2025-04-06 10:02:26 427 1

原创 DEYOLO和YOLO-MS

这篇文章主要融合RGB图像和红外图像，RGB图像提供丰富的纹理、颜色等细节信息，但易受到天气影响。红外图像不受天气影响能显示出场景中的热分布问题。为了提高在光照下的检测能力，将两者的优点进行结合，提高检测效果。作者主要在YOLO的基础上，创建了3个新的模块。1.DECA（a dual semantic enhancing channel weight assignment module），通过给通道赋予不同的权重，得到重要的通道，与另一种模态进行相乘，获得另一种模态的语义和纹理信息。

2025-03-31 16:15:41 841

原创 YOLOv12代码运行

打开requirements，显示torch 2.2.2 所以我的pytorch是2.2.2。4.因为是Windows系统，需要下载：windows版FlashAttention。安装完成后，安装flash_attn,后面的名字按照自己的修改。5.开发环境中安装 Python 包的命令，用于开发和调试阶段。3.安装requirements，注释掉第三行。剩下就可以在准备自己的数据集开始训练啦。cuda版本，打开cmd，命令行输入。下载后放在YOLOv12的根目录下。python我安装的是3.11。

2025-03-17 15:35:57 776

原创 conda更新后出现bug

解决办法：直接卸载重新安装如果需要保留之前的环境，直接复制envs到另一个盘里。然后卸载，重新安装

2025-03-15 18:10:30 376

原创 9月论文学习

Alexandria Engineering Journal 影响因子6.2摘要：为了应对水下环境的挑战，提出了MarineYOLO network。首先，将传统的C2f模块转变为EC2f模块，同时将模块引入到yolov8。此外，被引入，进一步细化了Feature Pyramid Network（FPN），增强小目标的特征提取。Wise-IoU替换了传统的CIoU，提高目标定位的精度和稳定性。在RUOD数据集上，AP值达到78.5%，URPC为88.1%。

2025-03-13 15:52:08 1352

原创 Debug：RuntimeError: expected scalar type Half but found Float

然后在linear,115行左右，这个改不改无所谓主要是网络配置结构有问题。然后仔细看了一下输出的网络结构，发现网络结构配置文件有问题。

2024-09-18 17:40:50 336 1

原创 yolov5代码

在train.py文件，在前面的地方，加入os.environ["GIT_PYTHON_REFRESH"] = "quiet"在我下载的yolov5的代码里，我并没有看见import os。

2024-09-04 14:58:17 1141

原创论文学习哇

在本文中，我们提出了一种新的目标检测模型YOLOX-ViT，并研究了知识蒸馏在不牺牲性能的情况下减少模型尺寸的有效性。我们的研究集中于水下机器人技术，解决了关于较小模型的可行性和YOLOX中视觉变压器层的影响的关键问题。此外，我们引入了一个新的侧扫描声纳图像数据集，并使用它来评估我们的目标探测器的性能。结果表明，知识蒸馏能有效地降低壁检测的误报。此外，引入的视觉变压器层显著提高了在水下环境中的目标检测精度。

2024-08-27 09:41:21 1128

原创 Yolov8网络结构学习

首先，使用1x1卷积核将输入通道数减少到原来的1/2，以减少计算量和内存消耗。yolov5中的C3模块在yolov8中被替换为了C2f，C2f则采用了yolov7中ELAN 多层堆叠的结构，增加了更多类似resnet残差块中的跳跃连接,丰富了模型的梯度流。在C2f模块中用到的DarknetBottleneck模块，使用多个3x3卷积核进行卷积操作，提取特征信息，同时其具有add是否进行残差链接的选项。与yolov5一样，每个卷积层的模块都采用步长为2的卷积核进行降采样操作，减少特征图的尺寸同时增加通道数。

2024-07-17 21:41:43 1696

原创 YOLOv7网络结构学习

backbone的基本组件就介绍完了，我们整体来看下 backbone，经过 4 个 CBS 后，接入例如一个 ELAN ，然后后面就是三个 MP1 + ELAN 的输出，对应的就是 C3/C4/C5 的输出，大小分别为 80 * 80 * 512 ， 40 * 40 * 1024， 20 * 20 * 1024。每一个 MP 由 5 层， ELAN 有 8 层，所以整个 backbone 的层数为 4 + 8 + 13 * 3 = 51 层，从 0 开始的话，最后一层就是第 50 层。

2024-07-17 11:24:22 4787

原创 YOLOv6网络结构学习

学习yolov6之前，可以先了解一下RepVGG推理是基于已训练好的模型或知识库，对新的或未知数据进行预测、分类或决策的过程。它的目的是应用已学到的知识和能力来解决实际问题。相比之下，训练是通过给定的数据集和算法调整模型参数，使模型能够从数据中学习并捕获有用的特征和规律。训练的目的是使模型在特定任务上达到较高的性能。

2024-07-15 07:42:44 596

原创 YOLOv5理论学习

SPPF。

2024-07-12 20:48:31 508

原创 yolo5s代码学习

x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous() # 确保张量是连续的定于forward，并接受参数xz=[] 推断时的输出z = []对输入x调整形状：bs na nx ny no nx,ny代表网格的大小 [1,3,32,32,85]

2024-07-05 19:59:28 1070

原创 YOLOv5理论学习

3.Warmup and Cosine LR scheduler：在训练的初期，将lr从一个非常小的值慢慢增长到所设置的初始学习率；两个5*5的池化相当于一个9*9的池化，三个5*5的池化相当于一个13*13的池化，虽然二者的计算结果一样，但是两个5*5、三个5*5更快。之前没有对高和宽进行限制，会出现梯度爆炸、训练不稳定等问题，修改之后，倍率因子变成了0-4之间，分类损失、目标损失、定位损失，针对不同的尺度，权重也不一样，倍数太大，岂不是和大的锚框重复了？那针对自己的数据集，是不是可以更改权重。

2024-07-03 10:28:30 637

原创 YOLOv4理论学习

2020 CVPR：SPP、PAN：YOLOv3优化策略：Eliminate grid sensitivity、Mosaic data augmentation、IoU threshold(match posotive samples)、Optimizered Anchors、CIOU。

2024-07-01 22:10:25 587

原创 YOLOv3 SPP

Mosaic图像增强是一种数据增强技术，通过将四张不同的图片拼接在一起，增加数据集的多样性和目标个数，从而丰富图片的背景信息。优点：增加数据的多样性、增加目标个数、BN能一次性统计多张图片的参数。

2024-06-28 18:33:27 911

原创 YOLOv3网络搭建

在train.py的63行左右，初始化模型，按住Ctrl和点击鼠标，跳转Darknet。

2024-06-27 21:11:20 2458

原创 YOLOv3网络结构配置文件

它使得任意大小的特征图都能够转换成固定大小的特征向量，其核心思想：把经典的金字塔池化结构Spatial Pyramid Pooling引入CNN中，从而使CNN可以处理任意尺寸的图片。为了解决ReLU在 x<0 时梯度消失引起的学习不安定问题，提出了Leaky ReLU，使得在 x<0 时也能让学习继续进行，便于让模型更具活性。ReLU函数在x<0时，函数值恒为0，且其导函数也为0，导致如果神经元的输出一旦变为0后，就再也无法复活。本文件在build_utils文件夹下的parse_config.py。

2024-06-25 09:24:07 979

Linxiaojiejieya的博客

原创 5.5 Underwater Image Enhancement via Wavelet Decomposition Fusion of Advantage Contrast（WWAC)

原创有关水下图像增强的论文

原创 U-shape_Transformer_for_Underwater_Image_Enhancement的复现

原创 4.1论文阅读

原创 DEYOLO和YOLO-MS

原创 YOLOv12代码运行

原创 conda更新后出现bug

原创 9月论文学习

原创 Debug：RuntimeError: expected scalar type Half but found Float

原创 yolov5代码

原创论文学习哇

原创 Yolov8网络结构学习

原创 YOLOv7网络结构学习

原创 YOLOv6网络结构学习

原创 YOLOv5理论学习

原创 yolo5s代码学习

原创 YOLOv5理论学习

原创 YOLOv4理论学习

原创 YOLOv3 SPP

原创 YOLOv3网络搭建

原创 YOLOv3网络结构配置文件

原创 YOLOv3理论学习

原创 YOLOv2理论学习

原创 YOLOv3代码实现

原创 YOLOv1理论学习

空空如也

空空如也