自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 10.18

在学习U-net系列算法的PPT时,我了解到U-net是一种非常简单但实用的网络结构,最初应用于医学图像分割领域,现在已广泛应用于其他图像分割任务。U-net的核心思想是通过编码和解码过程,实现对图像的分割任务。U-net++在U-net的基础上进行了改进,增强了特征的拼接和融合,使得特征的利用更加全面,同时通过Deep Supervision引入多输出损失的计算,提升了训练的效果。图像分割作为计算机视觉领域中的核心任务之一,主要是对图像中的像素进行分类,预测目标的轮廓,将像素划分到不同的类别中。

2024-10-18 16:02:05 186

原创 10.14

在学习安装YOLOv5的过程中,我体会到其优雅的设计和良好的文档支持为用户提供了极大的便利。相比于其他一些深度学习框架,YOLOv5的安装没有复杂的编译过程,这也体现了它的易用性。安装依赖时,requirements.txt文件包含了YOLOv5所需的主要Python库,如torch、opencv等,确保了模型训练和推理的顺利进行。代码的执行过程非常直观,模型推理速度快且准确度高,特别是在处理复杂的场景时,模型能够很好地识别多个目标物体。

2024-10-15 07:47:08 199

原创 10.21学习心得

与V2相比,V3的先验框种类更加丰富,共设置了9种先验框,分布在三个不同的特征图尺度上,极大提升了检测的灵活性。此外,YOLO V3引入了ResNet的残差连接结构,确保了在增加网络深度的同时不会引发梯度消失等问题,显著提升了网络的特征提取能力。此外,YOLO V2通过K-means聚类技术优化了先验框的选择,使得预测的框更加贴合数据集,提高了预测的准确度。最为创新的是多尺度输入策略,YOLO V2能够在不同的输入尺寸下进行训练和预测,确保了不同大小目标的检测效果,特别是在处理小目标时效果尤为显著。

2024-10-12 06:54:43 305

原创 目标检测yolo学习心得

同时,不同的数据集采用了不同的格式来表示Ground Truth,例如YOLO使用归一化的xywh格式,而VOC和COCO则分别使用XML和JSON格式。未来,我希望能够进一步实践这些算法,并将它们应用到实际的项目中去,提升我的模型构建和调优能力。目标检测不仅仅是识别图片中的物体,还需要精确定位物体的位置,这是一个多任务的过程,涉及到位置和类别的双重识别。尤其值得一提的是,目标检测中的非极大值抑制(NMS)技术,它通过设定置信度阈值,筛选出最有可能的目标,极大地减少了冗余的候选框,从而提高了检测的准确性。

2024-10-10 17:11:37 534

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除