CV
文章平均质量分 96
连理o
负优化砖家
展开
-
交并比 (IoU), mAP (mean Average Precision), 非极大值抑制 (NMS, Soft NMS, Softer NMS, IoU-Net)
目录NMS 基本过程抑制得分: Soft NMS加权平均: Softer NMS定位置信度: IoU-Net参考文献NMS 基本过程当前的物体检测算法为了保证召回率,对于同一个真实物体往往会有多于 1 个的候选框输出。由于多余的候选框会影响检测精度,因此需要利用 NMS 过滤掉重叠的候选框,得到最佳的预测输出在上图中,候选框 C 的得分比 A 要低,在评测时,C 候选框会被当做一个 False Positive 来看待,从而降低模型精度。实际上,由于候选框 A 的质量要比 C 好,理想的输出是原创 2021-12-08 16:53:42 · 1877 阅读 · 0 评论 -
样本不均衡问题 (OHEM, Focal loss)
目录不均衡问题分析正负样本不均衡难易样本不均衡类别间样本不均衡常用的解决方法在线难样本挖掘: OHEM难负样本挖掘 (Hard Negative Mining, HNM)在线难样本挖掘 (Online Hard Example Mining, OHEM)专注难样本: Focal LossFocal LossRetinaNet参考文献不均衡问题分析正负样本不均衡对于物体检测算法,有核心价值的是对应着真实物体的正样本,在训练时会根据其 loss 来调整网络参数。相比之下,负样本对应着图像的背景,如果有大原创 2022-03-15 18:58:12 · 2997 阅读 · 0 评论 -
两阶经典检测器: Faster R-CNN (Regions with CNN Features)
目录RCNN 系列发展历程开山之作: RCNN端到端: Fast RCNN走向实时: Faster RCNNFaster RCNN 总览详解 RPN (Region Proposal Network)生成 AnchorsRPN 的真值与预测量RPN 卷积网络RPN 真值的求取损失函数设计NMS 生成 Proposal筛选 Proposal 得到 RoIRoI Pooling 层RoI PoolingRoI Align全连接 RCNN 模块RCNN 全连接网络损失函数设计Faster RCNN 的改进算法审视原创 2021-12-08 21:30:35 · 2687 阅读 · 0 评论 -
单阶多层检测器: SSD (Single Shot Multibox Detector)
目录参考文献参考文献《深度学习之 PyTorch 物体检测实战》原创 2022-03-03 14:25:13 · 1391 阅读 · 0 评论 -
单阶经典检测器: YOLO (You Only Look Once)
目录无锚框预测:YOLO v1网络结构特征图的意义损失计算总结依赖锚框:YOLO v2网络结构的改善 - DarkNet先验框的设计正、负样本与损失函数训练技巧不足多尺度与特征融合:YOLO v3网络结构多尺度预测Softmax 改为 Logistic总结参考文献Faster RCNN 利用了两阶结构,先实现感兴趣区域的生成,再进行精细的分类与回归,虽出色地完成了物体检测任务,但也限制了其速度在此背景下,YOLO v1 利用回归的思想,使用一阶网络直接完成了分类与位置定位两个任务,速度极快。随后出现的原创 2022-01-26 08:53:40 · 1206 阅读 · 0 评论 -
物体检测难点 (多尺度检测, 遮挡与拥挤)
目录多尺度检测降低下采样率与空洞卷积Anchor 设计多尺度训练 (Multi Scale Training,MST)特征融合尺度归一化: SNIP (Scale Normalization for Image Pyramid)参考文献多尺度检测降低下采样率与空洞卷积对于小物体检测而言,降低网络的下采样率也许是最为简单的提升方式,通常的做法是直接去掉 Pooling 层,但这样虽然减小了下采样率,却会导致后续层的感受野与原有模型不同,如果使用预训练模型进行微调,则模型不能很好地收敛,因此可以使用空洞原创 2022-03-21 15:48:29 · 8047 阅读 · 2 评论 -
摆脱锚框:Anchor-Free
目录重新思考 AnchorAnchor 的弊端Anchor-Free基于角点的检测: CornerNet参考文献重新思考 AnchorAnchor 的弊端(1) 正、负样本不均衡:我们通常在特征图所有点上均匀采样 Anchor,而在大部分地方都是没有物体的背景区域,导致简单负样本数量众多,这部分样本对于我们的检测器没有任何作用(2) 超参难调:Anchor 需要数量、大小、宽高等多个超参数,这些超参数对检测的召回率和速度等指标影响极大。此外,人的先验知识也很难应付数据的长尾问题,这显然不是我们乐意原创 2022-03-26 23:12:36 · 4887 阅读 · 0 评论 -
双流网络: Two-Stream Convolutional Networks for Action Recognition in Videos
目录References加权平均Referencespaper: Two-Stream Convolutional Networks for Action Recognition in Videos双流网络论文逐段精读【论文精读】原创 2022-02-28 09:06:24 · 5612 阅读 · 2 评论 -
MoCo: Momentum Contrast for Unsupervised Visual Representation Learning
目录IntroductionReferencesIntroductionContrastive learning对比学习的目的是让模型学习哪些样本是相似的,哪些样本是不相似的。模型不需要知道样本所属的类别,只需要知道样本之间是否相似就可以了。也就是说,假如现在有三张图片 x1,x2,x3x_1,x_2,x_3x1,x2,x3,其中 x1,x2x_1,x_2x1,x2 是相似的,x3x_3x3 与 x1,x2x_1,x_2x1,x2 是不相似的。三张图片在经过编码器编码后得到三个特征原创 2022-02-13 13:38:06 · 1182 阅读 · 1 评论 -
Vision Transformer (ViT)
目录IntroductionMethodVision Transformer (ViT)ReferencesIntroductionViT 这篇论文提出,在图像分类任务中,CNN 并非必须的, pure Transformer 也能取得很好的效果。特别是在大量数据上预训练后再迁移到中小型数据集上时 (ImageNet, CIFAR-100, VTAB, etc.),相比 SOTA CNNs,ViT 仅需更少的训练资源就能取得更好的效果MethodVision Transformer (ViT)原创 2022-02-11 20:38:00 · 2684 阅读 · 0 评论 -
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
目录IntroductionMethodExperimentsImage Classification on ImageNet-1KReferencesSwin Transformer: Shifted WindowsIntroduction在视觉领域使用 Transformer 存在如下挑战:(1) 在已有的 Transformer 模型中,不同层级的 Transformer block 中的 tokens 感受野相同,均代表固定大小的 patch,不利于学习多尺度特征,不适合检测分割等密集预原创 2022-02-21 21:33:21 · 583 阅读 · 0 评论 -
Masked Autoencoders Are Scalable Vision Learners (MAE)
目录IntroductionApproachExperimentsImageNet ExperimentsMain PropertiesComparisons with Previous ResultsPartial Fine-tuningTransfer Learning ExperimentsReferencesIntroduction在 ViT 的 paper 中,作者就挖下了自监督学习的坑,而 MAE (Masked AutoEncoders) 就属于填坑之作,它在 ImageNet 上通过自原创 2022-02-12 12:22:39 · 1607 阅读 · 0 评论 -
目标检测 (一):边界框、锚框、多尺度目标检测
本文参考–PyTorch官方教程中文版链接:http://pytorch123.com/FirstSection/PyTorchIntro/Pytorch中文文档:https://pytorch-cn.readthedocs.io/zh/latest/package_references/Tensor/PyTorch英文文档:https://pytorch.org/docs/stable/tensors.html《深度学习之PyTorch物体检测实战》《动手学深度学习》代码参考:Dive-into-原创 2020-07-12 19:13:23 · 11878 阅读 · 5 评论 -
目标检测 (二):用于快速测试模型的小数据集--红绿灯数据集
本文参考–PyTorch官方教程中文版链接:http://pytorch123.com/FirstSection/PyTorchIntro/Pytorch中文文档:https://pytorch-cn.readthedocs.io/zh/latest/package_references/Tensor/PyTorch英文文档:https://pytorch.org/docs/stable/tensors.html《深度学习之PyTorch物体检测实战》《动手学深度学习》代码参考:Dive-into-原创 2020-07-13 14:44:57 · 3874 阅读 · 0 评论