zthwdd-CSDN博客

原创 10.18

在学习U-net系列算法的PPT时，我了解到U-net是一种非常简单但实用的网络结构，最初应用于医学图像分割领域，现在已广泛应用于其他图像分割任务。U-net的核心思想是通过编码和解码过程，实现对图像的分割任务。U-net++在U-net的基础上进行了改进，增强了特征的拼接和融合，使得特征的利用更加全面，同时通过Deep Supervision引入多输出损失的计算，提升了训练的效果。图像分割作为计算机视觉领域中的核心任务之一，主要是对图像中的像素进行分类，预测目标的轮廓，将像素划分到不同的类别中。

2024-10-18 16:02:05 186

原创 10.14

在学习安装YOLOv5的过程中，我体会到其优雅的设计和良好的文档支持为用户提供了极大的便利。相比于其他一些深度学习框架，YOLOv5的安装没有复杂的编译过程，这也体现了它的易用性。安装依赖时，requirements.txt文件包含了YOLOv5所需的主要Python库，如torch、opencv等，确保了模型训练和推理的顺利进行。代码的执行过程非常直观，模型推理速度快且准确度高，特别是在处理复杂的场景时，模型能够很好地识别多个目标物体。

2024-10-15 07:47:08 199

原创 10.21学习心得

与V2相比，V3的先验框种类更加丰富，共设置了9种先验框，分布在三个不同的特征图尺度上，极大提升了检测的灵活性。此外，YOLO V3引入了ResNet的残差连接结构，确保了在增加网络深度的同时不会引发梯度消失等问题，显著提升了网络的特征提取能力。此外，YOLO V2通过K-means聚类技术优化了先验框的选择，使得预测的框更加贴合数据集，提高了预测的准确度。最为创新的是多尺度输入策略，YOLO V2能够在不同的输入尺寸下进行训练和预测，确保了不同大小目标的检测效果，特别是在处理小目标时效果尤为显著。

2024-10-12 06:54:43 305

原创目标检测yolo学习心得

同时，不同的数据集采用了不同的格式来表示Ground Truth，例如YOLO使用归一化的xywh格式，而VOC和COCO则分别使用XML和JSON格式。未来，我希望能够进一步实践这些算法，并将它们应用到实际的项目中去，提升我的模型构建和调优能力。目标检测不仅仅是识别图片中的物体，还需要精确定位物体的位置，这是一个多任务的过程，涉及到位置和类别的双重识别。尤其值得一提的是，目标检测中的非极大值抑制（NMS）技术，它通过设定置信度阈值，筛选出最有可能的目标，极大地减少了冗余的候选框，从而提高了检测的准确性。

2024-10-10 17:11:37 534

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 10.18

原创 10.14

原创 10.21学习心得

原创 目标检测yolo学习心得

空空如也

空空如也

原创目标检测yolo学习心得