自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 YOLOv8 with Attention 注意力机制

YOLOv8 添加注意力机制

2024-07-10 15:34:03 991

原创 CLIP的loss计算

CLIP的loss计算

2024-07-09 15:20:35 176

原创 ONNX转换TensorRT,并进行推理预测

均是由于profile输入的名称或者size与onnx模型不一致,注意是NCHW还是NHWC。如果转换为onnx,那么onnx模型的数据类型也是float32,使用opencv或者PIL读取的图片数据类型是 int8,torch模型的默认数据类型是float32,###TensorRT 预测返回nan值。是由于输入的数据类型不对。

2024-07-07 17:07:52 198

原创 YOLOV8的Detect head 逐行解读

YOLOV8从不同的特征层,得到不同大小的特征图,然后预测每个特征图的每个格子anchor的类别概率,以及每个格子中物体的边框,即相对于中心点上下左右的偏移量box。

2024-07-04 17:39:17 1416

原创 keras模型转换onnx模型

1.keras一般先转换为tensorflow的pb格式,然后再使用tf2onnx转换。

2024-07-03 14:25:05 245

原创 Tensorflow模型转换onnx模型

Tensorflow模型转换为onnx模型

2024-07-03 14:20:45 410

原创 回车和换行(\r, \n, \r\n)的区别

而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。在解析文本或其他格式的文件内容时,常常要碰到判定回车换行的地方,这个时候就要注意既要判定"\r\n"又要判定"\n"。‘\r’ 回车,回到当前行的行首,而不会换到下一行,如果接着输出的话,本行以前的内容会被逐一覆盖;Windows系统里面,每行结尾是“<回车><换行>”,即“\r\n”;Unix系统里,每行结尾只有“<换行>”,即"\n";Mac系统里,每行结尾是“<回车>”,即"\r";

2024-07-02 17:01:56 288

原创 安装GPU,Cuda,Cudnn驱动

如果你对GPU驱动版本和cuda版本没有特殊要求,可不单独安装GPU驱动,在安装cuda驱动的时候,默认选择安装GPU驱动即可,也就是直接从第3步开始。

2024-07-02 16:54:31 183

原创 图像修复优化

将inpainter.model,也就是FFCResNetGenerator,分拆为两部分,forward_front部分主要是三次图像下采样,得到潜空间变量z1、z2,经过 forward_rear 部分得到预测结果,使用Adam优化z1、z2。如果图像的尺寸不满足下采样的条件,没有图像金字塔,则无法进行优化,直接返回结果。L1损失函数,默认求预测图像和输入图像的非mask部分的L1 loss。所以在图像金字塔中,分辨率按照从低到高排列。

2024-07-01 15:06:29 170

原创 large mask inpainting (LaMa)图像修复

3.经过三次下采样,for循环中只有两次下采样,第一次下采样在上一步,for循环中最后将输入分为 x_l:(b,128,h/8,w/8),x_g:(b,384,h/8,w/8)。论文:Resolution-robust Large Mask Inpainting with Fourier Convolutions。2.输入需要上下左右各加3个padding,因为需要使用kernel_size=7的卷积计算,以保持h,w不变。5.经过三次上采样,生成图像。4.经过6-18个残差模块。

2024-06-30 17:23:21 540

原创 Fast Fourier convolution (FFC)--快速傅里叶卷积

FFC残差模块,两个FFC_BN_ACT层作为残差。在FFC上增加了BN和ACT层。FFC–快速傅里叶卷积。

2024-06-29 18:57:39 327

原创 SpectralTransform

通过将空间维度分拆并重组,将空间分割后的特征映射到更多的通道上,可以使得网络能够更加专注于局部区域的特征提取,在频域处理之后再次进行空域的特征组合,从而实现频域和空域特征的有效融合。增加通道维度通常会增加网络的表达能力,因为它提供了更多的特征图用于学习不同的特征。SpectralTransform,频谱变换,对输入进行傅里叶变换和局部傅里叶变换,然后将两次变换结果和输入相加,再经过卷积融合。其中局部傅里叶变换,取前1/4个通道,分别在宽高维度拆分为两部分,通过重组增加通道数,再次进行傅里叶变换。

2024-06-28 14:23:18 192

原创 傅里叶卷积Fourier Convolutions

对输入tensor进行FFT,然后提取出实部和虚部,对实部和虚部进行卷积计算,再还原为实部和虚部,还原为tensor。中间可以对频率域使用SE,对不同的频率进行重标定。

2024-06-27 22:52:31 219

原创 CNN中的注意力机制

CNN的注意力机制,都是使网络在处理输入数据时,动态地聚焦于重要的部分,从而提高模型的性能和效率。每个模块的输入和输出都是一致的,可以方便的插入到现有模型中,替换不同的模块获得最优效果。

2024-06-27 14:43:15 1389

原创 残差模块和倒残差模块

ResNet(残差网络)和MobileNet分别针对不同的目标设计,这导致了它们在架构上的不同选择。

2024-06-26 16:04:52 291

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除