想要躺平的一枚
这个作者很懒,什么都没留下…
展开
-
单独使用YOLOV9的backbone网络
YOLO系列的网络结构都是通过.yaml来进行配置的,当要单独想使用其中的backbone网络时,可以通过yaml配置文件来进行网络搭建。原创 2024-04-13 15:27:14 · 87 阅读 · 0 评论 -
算法优化 —— 上、下采样篇
提示:以下是本篇文章正文内容,下面案例可供参考。原创 2024-03-18 11:44:12 · 122 阅读 · 0 评论 -
算法优化 —— 解码阶段的特征融合篇
提出的SDI模块,通过将高级特征的语义信息与低级特征的细粒度信息通过哈达马乘积相结合,增强每级特征图。原创 2024-03-07 10:11:47 · 63 阅读 · 0 评论 -
算法优化 —— 注意力机制篇
原论文链接二、BiFormer: 基于动态稀疏注意力构建高效金字塔网络架构(2023CVPR)原论文链接原创 2024-03-07 09:58:06 · 268 阅读 · 0 评论 -
图像分割标签噪声问题优化
在制作数据集时,标注数据时难免会存在噪声,如不同类别交界处存在模糊导致定位异常问题,训练过程梯度不稳定,网络对这部分数据的分类置信度较低(如其它中心区域的类别置信度都在0.9左右,而类别交界处的置信度只在0.5左右)原创 2024-02-22 10:26:25 · 86 阅读 · 0 评论 -
数据增强 —— 低亮度图像增强
因拍摄硬件和拍摄条件的限制,在某些情况下会存在低亮度的图像。无论是对标注还是算法都造成了困难。在标注mask时,尤其是分割类,低亮度图像很难看清目标轮廓;在算法上,也可以先对低亮度图像进行处理,再传入检测等算法当中,提高精度。因只是应对工作需要,所以具体原理不去了解,能使用即可。因没有时间去标注,故AI算法只记录无监督算法。原创 2024-01-24 11:24:30 · 86 阅读 · 0 评论 -
COCO数据格式的json文件内容以及转换为mask
- “segmentation”: 目标的分割掩码,表示目标的轮廓。- - “flickr_url”: 图像的Flickr URL(可选)。- - “date_captured”: 图像的拍摄日期(可选)。- - “coco_url”: 图像的COCO URL(可选)。- - “height”: 图像的高度(以像素为单位)。- - “width”: 图像的宽度(以像素为单位)。- - “image_id”: 标注所属的图像的ID。- - “category_id”: 目标类别的ID。原创 2024-01-03 17:00:55 · 670 阅读 · 0 评论 -
如何显示标注的纯黑mask图
通常情况下,使用标注软件标注的标签图看起来都是纯黑的,因为mask图为单通道的灰度图,而灰度图一般要像素值大于128后,才会逐渐显白,255为白色。而标注的时候,不同类别的像素值是从1,2,3...这样的顺序,所以看起来是纯黑的。原创 2023-11-13 14:21:47 · 1759 阅读 · 1 评论 -
模型训练——优化器Optimizer的选择
目前,深度学习领域,使用最广泛的优化器种类可分成:SGD和Adam一般来说,使用SGD进行训练,所需要的迭代次数会比较多,因为它收敛速度慢而稳定;Adam类的收敛速度比较快,迭代次数可以设置小一点。但要使用哪种优化器还是要取决于具体的任务和模型,在做项目时,可以先选择Adam类的,训练周期比较短。原创 2023-11-09 13:35:27 · 237 阅读 · 0 评论 -
图像分割项目中损失函数的选择
在图像分割领域,最基础、最常见的损失当然是交叉熵损失 —— Cross entropy。随着不断的研究,涌现出了许多优于交叉熵损失的,并且在实际场景中,也往往不会在单单使用交叉熵损失了。原创 2023-11-08 14:00:51 · 325 阅读 · 0 评论 -
如何测试模型的推理速度
(1)在进行时间测量时,确保在记录结束事件(end_event.record())之后立即调用 torch.cuda.synchronize() 方法以同步等待 GPU 操作完成是非常重要的。这样可以确保所有前向传递操作都已经完成,避免了异步操作的影响.(2)通常,Python 的时间戳time仅提供了秒级精度,而 torch.cuda.Event 可以提供更高的精度。原创 2023-11-07 16:50:16 · 501 阅读 · 0 评论 -
训练代码中num_worker的设置
上述代码,先得到cpu的最大核心数,再把num_worker从2、4、6、8…经实验发现,并不是num_worker越大,它的时间越少;并且,batchsize或图像尺寸的改变,也会改变其时间最少的num_worker值(如当batchsize=64,时间最少的num_worker为12;当batchsize=128时,时间最少的num_worker为8)。在此给出一个参考代码,通过设置的batchsize、图片尺寸与数据集的制作与加载,来查看哪个num_worker最快。原创 2023-10-25 11:32:21 · 3258 阅读 · 0 评论 -
torch张量的降维与升维
squeeze和unsqueeze是torch张量常用的降维与升维的一种方式,但这种方式只能增添或减少。但如果维度大小不为1,squeeze就无效了。原创 2023-10-23 11:27:54 · 575 阅读 · 0 评论 -
图像分割数据集的相关操作(二)—— 数据增强(albumentations和transfroms)
【代码】图像分割数据集的相关操作(二)—— albumentations 数据增强。原创 2023-10-18 17:45:49 · 324 阅读 · 0 评论 -
图像分割数据集的相关操作(一)—— 自定义随机裁剪与缩放
记录下遇到的数据集相关操作和自己的一些思考(可能是错的),仅供日后参考。原创 2023-07-19 17:01:52 · 395 阅读 · 0 评论