Qiming_v-CSDN博客

原创 YOLOv8 with Attention 注意力机制

YOLOv8 添加注意力机制

2024-07-10 15:34:03 991

原创 ONNX转换TensorRT，并进行推理预测

均是由于profile输入的名称或者size与onnx模型不一致，注意是NCHW还是NHWC。如果转换为onnx，那么onnx模型的数据类型也是float32，使用opencv或者PIL读取的图片数据类型是 int8，torch模型的默认数据类型是float32,###TensorRT 预测返回nan值。是由于输入的数据类型不对。

2024-07-07 17:07:52 198

原创 YOLOV8的Detect head 逐行解读

YOLOV8从不同的特征层，得到不同大小的特征图，然后预测每个特征图的每个格子anchor的类别概率，以及每个格子中物体的边框，即相对于中心点上下左右的偏移量box。

2024-07-04 17:39:17 1416

原创 keras模型转换onnx模型

1.keras一般先转换为tensorflow的pb格式，然后再使用tf2onnx转换。

2024-07-03 14:25:05 245

原创 Tensorflow模型转换onnx模型

Tensorflow模型转换为onnx模型

2024-07-03 14:20:45 410

而Windows里的文件在Unix/Mac下打开的话，在每行的结尾可能会多出一个^M符号。在解析文本或其他格式的文件内容时，常常要碰到判定回车换行的地方，这个时候就要注意既要判定"\r\n"又要判定"\n"。‘\r’ 回车，回到当前行的行首，而不会换到下一行，如果接着输出的话，本行以前的内容会被逐一覆盖；Windows系统里面，每行结尾是“<回车><换行>”，即“\r\n”；Unix系统里，每行结尾只有“<换行>”，即"\n"；Mac系统里，每行结尾是“<回车>”，即"\r"；

2024-07-02 17:01:56 288

原创安装GPU，Cuda，Cudnn驱动

如果你对GPU驱动版本和cuda版本没有特殊要求，可不单独安装GPU驱动，在安装cuda驱动的时候，默认选择安装GPU驱动即可，也就是直接从第3步开始。

2024-07-02 16:54:31 183

原创图像修复优化

将inpainter.model，也就是FFCResNetGenerator，分拆为两部分，forward_front部分主要是三次图像下采样，得到潜空间变量z1、z2，经过 forward_rear 部分得到预测结果，使用Adam优化z1、z2。如果图像的尺寸不满足下采样的条件，没有图像金字塔，则无法进行优化，直接返回结果。L1损失函数，默认求预测图像和输入图像的非mask部分的L1 loss。所以在图像金字塔中，分辨率按照从低到高排列。

2024-07-01 15:06:29 170

原创 large mask inpainting (LaMa)图像修复

3.经过三次下采样，for循环中只有两次下采样，第一次下采样在上一步，for循环中最后将输入分为 x_l：(b,128,h/8,w/8)，x_g：(b,384,h/8,w/8)。论文：Resolution-robust Large Mask Inpainting with Fourier Convolutions。2.输入需要上下左右各加3个padding，因为需要使用kernel_size=7的卷积计算，以保持h，w不变。5.经过三次上采样，生成图像。4.经过6-18个残差模块。

2024-06-30 17:23:21 540

原创 Fast Fourier convolution (FFC)--快速傅里叶卷积

FFC残差模块，两个FFC_BN_ACT层作为残差。在FFC上增加了BN和ACT层。FFC–快速傅里叶卷积。

2024-06-29 18:57:39 327

原创 SpectralTransform

通过将空间维度分拆并重组，将空间分割后的特征映射到更多的通道上，可以使得网络能够更加专注于局部区域的特征提取，在频域处理之后再次进行空域的特征组合，从而实现频域和空域特征的有效融合。增加通道维度通常会增加网络的表达能力，因为它提供了更多的特征图用于学习不同的特征。SpectralTransform，频谱变换，对输入进行傅里叶变换和局部傅里叶变换，然后将两次变换结果和输入相加，再经过卷积融合。其中局部傅里叶变换，取前1/4个通道，分别在宽高维度拆分为两部分，通过重组增加通道数，再次进行傅里叶变换。

2024-06-28 14:23:18 192

原创傅里叶卷积Fourier Convolutions

对输入tensor进行FFT，然后提取出实部和虚部，对实部和虚部进行卷积计算，再还原为实部和虚部，还原为tensor。中间可以对频率域使用SE，对不同的频率进行重标定。

2024-06-27 22:52:31 219

原创 CNN中的注意力机制

CNN的注意力机制，都是使网络在处理输入数据时，动态地聚焦于重要的部分，从而提高模型的性能和效率。每个模块的输入和输出都是一致的，可以方便的插入到现有模型中，替换不同的模块获得最优效果。

2024-06-27 14:43:15 1389

原创残差模块和倒残差模块

ResNet（残差网络）和MobileNet分别针对不同的目标设计，这导致了它们在架构上的不同选择。

2024-06-26 16:04:52 291

Qiming的博客