计算机视觉面试31题：CV面试考点，精准详尽解析（1-10）

niuyunpang

于 2021-05-27 16:34:31 发布

阅读量2.2k

点赞数

文章标签：人工智能机器学习算法 cv 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niuyunpang/article/details/117298114

版权

这篇博客是计算机视觉面试的要点解析，涵盖了目标检测技术的发展，如R-CNN家族与YOLO、SSD，以及IOU的解释。还讨论了KNN和K-means的区别，介绍了线性分类器的原理，以及log、Hinge Loss和Cross-Entropy Loss等损失函数。此外，文章提及了正则化与奥卡姆剃刀原则，以及卷积层参数量过大时的处理策略。最后，解释了神经网络为何被称为端到端网络。

摘要由CSDN通过智能技术生成

篇幅有限，本文不会把每一题的参考答案都加载出来，会摘出一些摘要，完整解析见题库！
添加老师微信：julyedufu77，回复 ” 6 “ ，领取最新升级版《名企AI面试100题》电子书！

1、基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一、目标检测常见算法

object detection，就是在给定的图片中精确找到物体所在位置，并标注出物体的类别。所以，object detection要解决的问题就是物体在哪里以及是什么的整个流程问题。

然而，这个问题可不是那么容易解决的，物体的尺寸变化范围很大，摆放物体的角度，姿态不定，而且可以出现在图片的任何地方，更何况物体还可以是多个类别。

目前学术和工业界出现的目标检测算法分成3类：

传统的目标检测算法：Cascade + HOG/DPM + Haar/SVM以及上述方法的诸多改进、优化；

**2. 候选区域/框 + 深度学习分类：**通过提取候选区域，并对相应区域进行以深度学习方法为主的分类的方案，如：

R-CNN（Selective Search + CNN + SVM）

SPP-net（ROI Pooling）

Fast R-CNN（Selective Search + CNN + ROI）

Faster R-CNN（RPN + CNN + ROI）

R-FCN

等系列方法；

****3. 基于深度学习的回归方法：****YOLO/SSD/DenseBox 等方法；以及最近出现的结合RNN算法的RRC detection；结合DPM的Deformable CNN等
在这里插入图片描述

传统目标检测流程：

1）区域选择（穷举策略：采用滑动窗口，且设置不同的大小，不同的长宽比对图像进行遍历，时间复杂度高）

2）特征提取（SIFT、HOG等；形态多样性、光照变化多样性、背景多样性使得特征鲁棒性差）

3）分类器分类（主要有SVM、Adaboost等）

2、请简单解释下目标检测中的这个IOU评价函数（intersection-over-union）

解析一

在目标检测的评价体系中，有一个参数叫做 IoU ，简单来讲就是模型产生的目标窗口和原来标记窗口的交叠率。具体我们可以简单的理解为：即检测结果(DetectionResult)与 Ground Truth 的交集比上它们的并集，即为检测的准确率 IoU :

计算机视觉面试31题：CV面试考点，精准详尽解析（1-10）

如下图所示：GT = GroundTruth; DR = DetectionResult;

黄色边框框起来的是：

GT⋂DR

绿色框框起来的是：

GT⋃DR

应该够详细了，上幅图直观些。当然最理想的情况就是 DR 与 GT 完全重合，即

IoU=1

下面附上图例说明
在这里插入图片描述

原图则如下
计算机视觉面试31题：CV面试考点，精准详尽解析（1-10）

3、KNN与K-means区别？

Wikipedia上的 KNN词条中有一个比较经典的图如下：
在这里插入图片描述

KNN算法流程：

从上图中我们可以看到，图中的数据集是良好的数据，即都打好了label，一类是蓝色的正方形，一类是红色的三角形，那个绿色的圆形是我们待分类的数据。

如果K=3，那么离绿色点最近的有2个红色三角形和1个蓝色的正方形，这3个点投票，于是绿色的这个待分类点属于红色的三角形。

如果K=5，那么离绿色点最近的有2个红色三角形和3个蓝色的正方形，这5个点投票，于是绿色的这个待分类点属于蓝色的正方形。

我们可以看到，KNN本质是基于一种数据统计的方法！其实很多机器学习算法也是基于数据统计的。

KNN是一种memory-based learning，也叫instance-based learning，属于lazy learning。即它没有明显的前期训练过程，而是程序开始运行时，把数据集加载到内存后，不需要进行训练，就可以开始分类了。具体是每次来一个未知的样本点，就在附近找K个最近的点进行投票。

K-Means介绍：

最低0.47元/天解锁文章

关注

0
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
计算机视觉面试31题：CV面试考点，精准详尽解析（1-10）

篇幅有限，本文不会把每一题的参考答案都加载出来，会摘出一些摘要，完整解析见题库！添加老师微信：julyedukefu14，回复 ” 6 “ ，领取最新升级版《名企AI面试100题》电子书！1、基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD一、目标检测常见算法object detection，就是在给定的图片中精确找到物体所在位置，并标注出物体的类别。所以，object detection要解决的问题就是物体在哪里以及是什么的整个流程问题。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。