牛客网刷题答案记录（一）：百度计算机视觉

最新推荐文章于 2023-08-09 02:06:15 发布

凉童鞋

最新推荐文章于 2023-08-09 02:06:15 发布

阅读量786

点赞数

分类专栏：牛客网

原文链接：https://www.nowcoder.com/test/question/analytic?tid=41416977

版权

牛客网专栏收录该内容

1 篇文章 0 订阅

订阅专栏

目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage，分别写出了解的对应的算法。在共性上两类检测算法有哪些差异？

One-stage：yolov1、yolov2、yolov3、SSD、RetinaNet
Two-stage：Fast R-CNN、Faster R-CNN
Two-stage检测算法的共性，以faster r-cnn为例，使用了复杂的网络用于每个候选区域的分类和回归；ROI pooling后的feature channels数目较大，导致内存消耗和计算量都比较大。
One-stage检测算法的共性，从网络结构上看只是多分类的rpn网络，相当于faster rcnn的第一阶段，因此one-stage主要的优势是速度快。其预测结果是从feature map回归出目标的位置及分类，有的也采用了anchor的概念。
而two-stage对上述结果进行roi pooling后会进一步细化，因此two-stage算法检测精度一般相对较高。还有一种观点是，two-stage的rpn部分相当于做了正负样本均衡，这也是two-stage检测效果相对较好的一个原因。
one-stage算法对小目标检测效果较差，如果所有的anchor都没有覆盖到这个目标，那么这个目标就会漏检。如果一个比较大的anchor覆盖了这个目标，那么较大的感受野会弱化目标的真实特征，得分也不会高。two-stage算法中的roi pooling会对目标做resize, 小目标的特征被放大，其特征轮廓也更为清晰，因此检测也更为准确。

在不具备雷达等有测距能力传感器的情况下，如何仅通过单目相机计算出地面上目标的距离？

采用IPM（Inverse Perspective Mapping）方法来实现。主要有两种方式来生成IPM图像
方案一：假设地面是平的，采用直接计算单应矩阵H投影的方式。手动或自动选取图像和三维空间点对应的4组标记点，计算出原始图像到IPM变换图像的单应矩阵H。因此图像坐标系中地平面上的任一点，乘以H矩阵后都可以计算出真实三维空间下的坐标。
方案二：同样需要地面是平的假设，通过标定出相机的内参数和外参数，投影换算出图像地平面和三维空间的关系。

相机模型有哪些参数，写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种，对应畸变矫正的公式表达？

相机模型的内参数重要有：主点，焦距，畸变系数。
三维空间点到二维图像的投影公式：
镜头畸变：径向畸变和切向畸变。
径向畸变矫正公式表达：
切向畸变矫正公式表达：

关于K-means聚类算法，请回答以下问题：

K-means是有监督聚类还是无监督聚类？
写出将N个样本（X=(x1,…,xN)）聚成K类的K-means聚类算法的优化目标函数。
请用伪代码写出聚类过程。
假设样本特征维度为D，请描述Kmeans算法时间复杂度。

1）无监督聚类
2）对于样本xi，计算其分类：

ci表示类别，uj表示质心
那么优化目标函数可以表示为：

N表示样本量，ui表示ci的质心
3）伪代码：
def Kmeans (输入数据，类簇的个数K):
初始计算K个质心点
repeat
计算数据中每个点到各个质心的距离，其中到质心距离最短的点被分为同一个簇，最后得到K个类簇
重新计算K个类簇的质心
until 知道所有样本的类簇不发生改变或达到最大迭代次数
4）假设数据量为N，数据维度为D，K为簇的个数，I为迭代次数，那么Kmeans算法的时间复杂度为：N×D×K×I