计算机视觉面试
文章平均质量分 92
ZF_YES
这个作者很懒,什么都没留下…
展开
-
计算机视觉面试(四)
计算机视觉面试(三) 1.手撕NMS 在现有的基于anchor的目标检测算法中,都会产生数量巨大的候选矩形框,这些矩形框有很多是指向同一目标,因此就存在大量冗余的候选矩形框。非极大值抑制算法的目的正在于此,它可以消除多余的框,找到最佳的物体检测位置。 实现步骤如下: 1.设定目标框的置信度阈值,常用的阈值是0.5左右 2.根据置信度降序排列候选框列表 3.选取置信度最高的框A添加到输出列表,并将其从候选框列表中删除 4.计算A与候选框列表中的所有框的IoU值,删除大于阈值的候选框 5.重复上述过程,直到原创 2021-12-23 16:08:37 · 2448 阅读 · 0 评论 -
计算机视觉面试(三)
计算机视觉面试(三) 1. 使用大卷积核的好处 在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射的区域大小。再通俗点的解释是,特征图上的一个点对应输入图上的区域,如下图所示: 个人感觉使用大卷积核的作用是增大感受野。 但是相比于使用一个大卷积核的卷积运算,比如5X5 的卷积运算,跟推荐使用2个3X3的卷积替代,其感受野是一样的。 先回顾一下卷积神经网络特征图大小的计算: 再回顾如何计算感受野: 先可视化一原创 2021-12-13 10:33:55 · 2161 阅读 · 0 评论 -
计算机视觉面试(二)
计算机视觉面试(二) ROI pooling 作用 一、提出的原因 对于Two-stage目标检测大概分为两步: 1.给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为 region proposals或者 regions of interest(ROI)。 2.根据上一阶段的region proposal确定是否属于目标。 这样子可能会导致一些问题: 1.检测速度过慢,不能达到实时性要求。 2.无法做到end原创 2021-12-10 14:03:55 · 2708 阅读 · 1 评论