白鹿。-CSDN博客

原创 04.yolov1原论文阅读总结

1）相比之前的目标检测重复利用分类器，yolo将目标检测问题转换为了一个回归问题，将边界框和相关的额类别概率从空间上分离了。一个单一的神经网络在整个图片做一次前向推断就可以预测边界框及其类别概率。这是因为yolo将整个检测流程整合进了一个网络中，所以它能直接从端到端优化检测性能。2）基础的yolo模型可以以每秒45帧的速度处理处理图像，而一个更小的版本Fast Yolo怎可以以每秒155帧的速度处理图像，检测速度是同时期其他实时检测算法的两倍。

2023-11-14 21:52:16 76 1

原创 03.Faster-RCNN论文阅读总结

1）与高效的检测网络相比，选择性搜索要慢一个数量级，在CPU实现中，每幅图像2秒。2）通过添加一些额外的卷积层来构建RPN，这些卷积层同时在一个规则网格上的每个位置回归区域边界（区域建议的边界框）和对象属性分数（判断该区域是背景还是目标）。3）引入了新颖的“锚”框，作为多个尺度和宽高比的参考，它避免了多尺度或高宽比的图像或过滤器的枚举。anchor是指在输入图像中生成的一系列固定大小和宽高比的边界框。这些边界框作为候选目标区域，用于在图像中定位和识别物体。

2023-11-14 10:10:36 53 1

原创 02.Fast-RCNN原论文阅读

1）与图像分类任务相比，目标检测任务更加复杂和具有挑战性，因此当前训练模型的方法在multi-stage pipelines中是缓慢的。2）准确定位目标的复杂性产生了两个挑战。首先，必须处理大量候选对象位置（区域建议）。其次，这些候选区域简单的存放在本地中（磁盘中），必须对其进行细化以实现精确的本地化（减少数据量）。这些问题的解决方案通常会牺牲速度、准确性或简单性。3）本文提出了一种单阶段训练算法，可以共同学习对目标建议（区域建议）进行分类并细化其空间位置。

2023-11-08 22:41:45 69

原创 01.RCNN（2014）论文阅读总结

1）在RCNN提出之前，各种视觉识别任务多基于SIFT和HOG的使用，这使得目标检测性能的提升非常有限。2）通过更高级，多阶段的过程来计算特征，这对于视觉识别来说更有意义。3）Lecun等人证明了通过反向传播的随机梯度下降对训练卷积神经网络(convolutional neural networks, cnn)是有效的。（论文：Backpropagation applied to handwritten zip code recognition. Neural Comp., 1989）

2023-11-08 12:35:50 47 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人