qq_40632955-CSDN博客

论文采用了多种适用于大多数模型的通用特征，如跨阶段部分连接（Cross-Stage-Partial-connections (CSP)）、跨小批量归一化(Cross mini-Batch Normalization (CmBN))、Mish activation、Mosaic data augmentation，CIoU loss等方法，进一步提升了yolo的精度- 43.5% AP (65.7% AP50) on MS COCO dataset - ∼65 FPS- 能够使用单GPU训练

2022-08-21 21:38:13 1146

原创 YOLOv3(2018)论文笔记

论文在yolov2的基础上提供了一些更新，做了一些小改动，与同精度的模型快多倍。

2022-08-21 08:55:35 1028

原创 YOLOv2(2017)论文笔记

论文提出了YOLOv2以及YOLO9000，YOLO9000是使用了联合训练方法，能够预测超过9000个目标类别- 借鉴了多种前人的提升方法，精度达到STOA，在voc 2007上，67FPS，76.8mAP和40FPS，78.6mAP，超过Faster RCNN(resnet)，- 论文使用分类和检测联合训练的方法，使得模型能预测超出原本带有标签检测的类别。

2022-08-20 18:38:37 1107 1

原创 YOLOv1(2016)论文笔记

提出了yolo目标检测模型，- 将目标检测问题作为边框和相关类别概率的回归问题- 它是端到端网络，直接从整张图像预测- 速度非常快，基础的网络达到45FPS，更小的网络达到155FPS，但精度没有达到STOA，mAP约为63.4%- 它的泛化能力从自然图像到艺术作品比较好。

2022-08-19 18:49:59 578

原创 R-CNN(2014)论文笔记

当时目标检测性能停滞不前，主要是融合底层特征和高层特征的复杂集成系统，论文提出了RCNN，即在region proposal 的基础上，使用CNN来进行定位在数据集数量少的情况下，使supervised pre-training & domain-specific finetuning。其他细节可视化特征提取网络各个层学习到的特征，并对CNN中各个layer进⾏消融实验分析得出RCNN的主要问题是poor localization，并通过BB regression去解决。............

2022-08-11 14:28:13 753

原创 Fast R-CNN（2015）论文笔记

针对当时主流目标检测算法训练都是multi-stage training pipeline，这过程麻烦，且需要额外的存储空间，论文提出one-stage 训练方案，a multi-task loss，也可以更新所有网络的参数。模型使用VGG16，比RCNN训练快9倍，测试快213倍，比SPPnet，训练快3倍，测试快10倍。论文在实验中精度上达到了最优（ VOC07, 2010, and 2012）进行了9组实验。......

2022-08-09 13:15:10 404

原创 Faster RCNN（2016）论文笔记

论文主要针对当时目标检测中region proposal computation 耗时的问题，在fast rcnn上提出了全卷积RPN，可以端到端的训练来产生region proposal，该方法与fast rcnn 共享卷积特征，几乎没有额外的耗时。论文在实验中精度上达到了最优(PASCAL VOC 2007和2012以及MS COCO）在GPU上整个算法达5fps（VGG16）region proposal仅需10ms进行了10组实验。.................................

2022-08-08 09:09:13 447

原创 U-Net（2015）论文笔记

论文在FCN基础上进行扩展和修改，提出了U型对称的全卷积网络。该网络在上采样部分依旧有大量的channel，拥有丰富的上下文信息。该网络结合数据增强和改进的loss，在医学少量数据上，也能精确分割，且推理一张512x512的图像只需不到1秒。在ISBIcelltrackingchallenge2015上IOU精度达到最优，(0.9203和0.7756）进行了2组实验在医学领域，提出了U型对称全卷积架构。......

2022-07-29 12:06:17 1045

原创 DeeplabV3+(2018)论文笔记

论文在deeplabv3的基础上添加了decoder结构，提出了deeplabv3+deeplabv3中ASPP（空洞空间卷积金字塔）具有提取多尺度上下文信息（等同不同大小的感受野，卷积核参数量也不会增加）添加的decoder可以提取精细的目标边界空洞卷积可以提取backbone中任意分辨率的feature改进xception作为backbone，使用深度可分离卷积，提神精度，减少了参数量和计算量，............

2022-07-27 14:57:03 1711

原创 SegNet（2017）论文笔记

论文针对场景理解需求提出了SegNet模型，将原来用于无监督学习的自编码器（encoder-decoder）用于图像分割针对图像分割特定问题，在上采样时，采用带索引的反池化操作，保留了边界信息，提升了分割精度。论文在SegNet和FCN上设计了不同的解码器变体，定量分析了解码器影响精度的关键因素。论文在实验精度上没有达到最优，仅推理内存最低进行了6组实验在图像分割中引入了encoder-decoder的对称架构。............

2022-07-21 15:53:58 873 1

原创 FCN（2015）论文笔记

FCN是一篇发表在2015CVPR上的一篇论文，首个端到端的针对像素级预测的全卷积网络，是图像语义分割的开山之作。论文在实验中精度上达到了最优（PASCALVOC2012，NYUDv2,和SIFTFlow）PASCALVOC2012在上提升了20%达到了62.2%meanIUFPS达到5.7张/s，推理时间175ms（PASCALVOC）进行了8组实验提出了端到端，点对点像素级别预测的全卷积网络提出“skip”结构，连接深层语义和浅层精细信息。............

2022-07-20 13:51:31 801 1

翻译 MobileNetV3（2019）论文笔记

mobileNetV3学习笔记

2022-07-14 13:31:11 939

翻译 MobileNetV2（2019）论文笔记

mobilenet v2 学习笔记

2022-07-13 14:42:53 964

翻译 MobileNetV1（2017）论文笔记

MobileNets: Efficient Convolutional Neural Networks for Mobile VisionApplicationsMobileNets：用于移动视觉应用的高效卷积神经网络我们提出了一类名为MobileNets的高效模型，用于移动和嵌入式视觉应用。MobileNets是基于一个精简的架构，使用深度可分离卷积来构建轻量级的深度神经网络。我们引入了两个简单的全局超参数，在延迟和准确性之间进行有效的权衡。这些超参数允许模型构建者根据问题的限制为他们的应用选择合适的

2022-07-11 18:02:06 224

qq_40632955的博客

原创 python 基础

原创 YOLOv4(2020)论文笔记