自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 SSD 论文总结

这篇文章中作者在网络的六个不同的层次提取了特征,最后将这些特征结合,让网络有了多尺度检测的能力,而且这个网络的速度相比于当时先进的two-stage网络(如:Faster R-CNN)有更快的速度和更高的准确率。SSD不同于目前比较主流的sliding windows和region proposal,它主要依靠不同尺度上的default boxes进行检测,避免了像sliding windows那样低效的方式,使得检测的速度更快。还结合了不同尺度的特征,使他有着更高的精确度。

2024-08-07 21:24:34 567

原创 RetinaNet 论文总结

一般来说,one-stage的目标检测器在检测速度上有着明显优势,而two-stage的目标检测器的精确度比较高。但是RetinaNet的创造者们通过利用一种在cross entropy loss的基础上改进过的损失函数代替传统的损失函数,这使得一个one-stage的模型有了更高的速度和精确度。论文标题:Focal Loss for Dense Object Detection“目前最高准确度的目标检测器基于一种由R-CNN推广的两阶段方法,在稀疏的一组候选目标位置上应用分类器。

2024-08-05 19:57:46 718

原创 YOLOv3 论文总结

YOLOv3是一个 one-stage 的目标检测网络。YOLOv3 作为 one-stage 方法的代表,其设计目标是实现实时的高效目标检测,在一次前向传播中直接输出检测结果。One-stage 方法: 如 YOLO (You Only Look Once) 系列和 SSD (Single Shot MultiBox Detector)。这些方法在一次前向传播中直接从输入图像中预测出目标的类别和位置。这类方法通常速度较快,因为它们省去了中间的候选区域生成步骤。

2024-08-04 16:31:41 784

原创 几种常见分类神经网络

当多个小卷积核堆叠时,尽管每层单独的感受野较小,但累积起来的感受野能够覆盖更大的区域,因此可以学习到更复杂的特征表示。4. 第二个卷积层(Conv2):包含 256 个大小为 5x5x48 的卷积核(48 是由于之前的池化层有 2 倍的通道数),步长为 1,使用 ReLU 激活函数。通过增加网络的深度,可以在特征空间中找到更有效的表示,这对于高精度的图像分类任务尤其重要。数据集上进行训练,这个数据集包含了大量的标注图像,为模型提供了丰富的训练数据,有助于提高模型的性能和泛化能力。

2024-08-04 12:27:51 990

原创 Faster R-CNN 论文总结

RPN通过滑动窗口机制遍历从卷积神经网络传来的特征图,在每一个位置生成9个anchors(分别为 Scales:128² px, 256² px, 512² px Aspect Ratios:1:1,1:2,2:1),对于每个锚框,RPN 输出一个对象性得分(objectness score)和相应的边界框回归(bounding box regression)。2.从剩余的预测框中选择一个与基准框的重叠面积最大的框,如果其重叠面积大于一定的阈值,则将其删除。2.经过卷积神经网络生成的特征图;

2024-07-27 19:20:14 511

原创 每周科研总结

日期:2024年07月19日本周的研究目标是通过阅读相关领域的金典论文,深入了解当前研究的方向。预期成果包括拓展知识面、寻找研究灵感,以及为后续的实验设计和数据分析奠定理论基础。

2024-07-19 21:16:40 758

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除