- 博客(12)
- 资源 (3)
- 问答 (3)
- 收藏
- 关注
转载 目标检测之九:其他
9.其他方法除去上面所列的技巧外,还有一些做法也值得注意:更好的先验(YOLOv2):使用聚类方法统计数据中box标注的大小和长宽比,以更好的设置anchor box的生成配置 更好的pre-train模型:检测模型的基础网络通常使用ImageNet(通常是ImageNet-1k)上训练好的模型进行初始化,使用更大的数据集(ImageNet-5k)预训练基础网络对精度的提升亦有帮助 超...
2020-02-26 23:46:36 159
转载 目标检测之八:RoIAlign
8.RoIAlign RoI对齐RoIAlign是Mask R-CNN([7])的工作中提出的,针对的问题是RoI在进行Pooling时有不同程度的取整,这影响了实例分割中mask损失的计算。文章采用双线性插值的方法将RoI的表示精细化,并带来了较为明显的性能提升。这一技巧也被后来的一些工作(如light-head R-CNN)沿用。这一部分暂时没有代码解析。https://zhuan...
2020-02-26 23:44:24 764
转载 目标检测之七:Soft NMS
https://zhuanlan.zhihu.com/p/1028171807.Soft NMS 软化非极大抑制NMS后处理图示NMS(Non-Maximum Suppression,非极大抑制)是检测模型的标准后处理操作,用于去除重合度(IoU)较高的预测框,只保留预测分数最高的预测框作为检测输出。Soft NMS由[6]提出。在传统的NMS中,跟最高预测分数预测框重合度超出一定...
2020-02-26 23:43:32 1892
转载 目标检测之六:OHEM 在线难例挖掘
https://zhuanlan.zhihu.com/p/1028171806.OHEM 在线难例挖掘OHEM(Online Hard negative Example Mining,在线难例挖掘)见于[5]。两阶段检测模型中,提出的RoI Proposal在输入R-CNN子网络前,我们有机会对正负样本(背景类和前景类)的比例进行调整。通常,背景类的RoI Proposal个数要远远多于前...
2020-02-26 23:40:53 2834
转载 目标检测之五:随机权值平均(Stochastic Weight Averaging,SWA)---木有看懂
随机权值平均(Stochastic Weight Averaging,SWA)随机权值平均只需快速集合集成的一小部分算力,就可以接近其表现。SWA 可以用在任意架构和数据集上,都会有不错的表现。根据论文中的实验,SWA 可以得到我之前提到过的更宽的极小值。在经典认知下,SWA 不算集成,因为在训练的最终阶段你只得到一个模型,但它的表现超过了快照集成,接近 FGE(多个模型取平均)。左图...
2020-02-26 23:35:45 4472
转载 目标检测之四:预测框微调/投票法/模型融合
4.Box Refinement/Voting 预测框微调/投票法/模型融合微调法和投票法由工作[4]提出,前者也被称为Iterative Localization。微调法最初是在SS算法得到的Region Proposal基础上用检测头部进行多次迭代得到一系列box,在ResNet的工作中,作者将输入R-CNN子网络的Region Proposal和R-CNN子网络得到的预测框共同进行N...
2020-02-26 23:33:24 2756
转载 目标检测之三:全局语境
3.Global Context 全局语境这一技巧在ResNet的工作[3]中提出,做法是把整张图片作为一个RoI,对其进行RoI Pooling并将得到的feature vector拼接于每个RoI的feature vector上,作为一种辅助信息传入之后的R-CNN子网络。目前,也有把相邻尺度上的RoI互相作为context共同传入的做法。这一部分暂时没有代码解析。https://...
2020-02-26 23:29:07 648
转载 目标检测之二:多尺度
https://zhuanlan.zhihu.com/p/102817180Multi-scale Training/Testing 多尺度训练/测试可参考:初识CV:MMDetection中文文档—4.技术细节zhuanlan.zhihu.com输入图片的尺寸对检测模型的性能影响相当明显,事实上,多尺度是提升精度最明显的技巧之一。在基础网络部分常常会生成比原图小数十倍的特征图,...
2020-02-26 23:26:59 4390
转载 目标检测之一: anchor ratio
以cascade_rcnn_r50为例:默认参数是anchor_ratio=[0.5, 1.0, 2.0]anchor_ratio默认参数如何去修改这一部分参数呢?这个参数的含义是长边和短边的比例,一般都是成对出现的(乘积为1),比如。详细解析请自行查找anchor机制,本篇重点是对特定的数据集如何去选取anchor_ratio。要想解决这一部分问题,首先要对你训练的数据进...
2020-02-26 23:11:32 1821
转载 数据增强:裁剪 》 flip 》 erasing(缓解遮挡)
https://zhuanlan.zhihu.com/p/103267422论文阅读】random erasing data augmentationcode论文说明论文为CNN训练提出了一种新的数据增强方法。Random Erasing,在一张图片中随机的选择一个矩形框,在随机的位置上使用随机的值来擦除图片原来的像素。通过该方法能够给图片加入不同程度的遮挡,通过这样的训练数据,可以...
2020-02-25 22:38:22 820
转载 Inside-Outside Net:ion
核心亮点:1.多尺度2.rnn获取全局信息。收录于CVPR20161.Contribution本文主要关注目标检测过程中的上下文信息以及多尺度信息两个方面,提出了Inside-Outside Net:Inside Net: 采用skiping pooling的方式连接不同卷积层输出的feature map,实现多尺度特征的融合Outside Net: 采用IRNN的结构,整合...
2020-02-24 23:45:17 637 1
转载 map的只管理解
不得不提目标检测中衡量检测精度的指标mAP(mean average precision)。简单来讲就是在多个类别的检测中,每一个类别都可以根据recall和precision绘制一条曲线,那么AP就是该曲线下的面积,而mAP是多个类别AP的平均值,这个值介于0到1之间,且越大越好。具有代表性的工作是ResNet、ION和HyperNet。转自:https://blog.csdn.net/...
2020-02-24 22:02:05 627
阅读英语芯片手册的技巧
2013-02-27
stm32启动过程详解
2013-02-27
关于cvWaitKey的工作机理;图像的闪烁问题;CPU下降措施
2015-07-28
VS编写的GMM函数,效率问题
2015-07-28
关于OPENCV 中MOG的问题,关于背景比例阈值的理解。
2015-07-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人