牛客网刷题答案记录(一):百度计算机视觉

目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage,分别写出了解的对应的算法。在共性上两类检测算法有哪些差异?

One-stage:yolov1、yolov2、yolov3、SSD、RetinaNet
Two-stage:Fast R-CNN、Faster R-CNN
Two-stage检测算法的共性,以faster r-cnn为例,使用了复杂的网络用于每个候选区域的分类和回归;ROI pooling后的feature channels数目较大,导致内存消耗和计算量都比较大。
One-stage检测算法的共性,从网络结构上看只是多分类的rpn网络,相当于faster rcnn的第一阶段,因此one-stage主要的优势是速度快。其预测结果是从feature map回归出目标的位置及分类,有的也采用了anchor的概念。
而two-stage对上述结果进行roi pooling后会进一步细化,因此two-stage算法检测精度一般相对较高。还有一种观点是,two-stage的rpn部分相当于做了正负样本均衡,这也是two-stage检测效果相对较好的一个原因。
one-stage算法对小目标检测效果较差,如果所有的anchor都没有覆盖到这个目标,那么这个目标就会漏检。如果一个比较大的anchor覆盖了这个目标,那么较大的感受野会弱化目标的真实特征,得分也不会高。two-stage算法中的roi pooling会对目标做resize, 小目标的特征被放大,其特征轮廓也更为清晰,因此检测也更为准确。

在不具备雷达等有测距能力传感器的情况下,如何仅通过单目相机计算出地面上目标的距离?

采用IPM(Inverse Perspective Mapping)方法来实现。主要有两种方式来生成IPM图像
方案一:假设地面是平的,采用直接计算单应矩阵H投影的方式。手动或自动选取图像和三维空间点对应的4组标记点,计算出原始图像到IPM变换图像的单应矩阵H。因此图像坐标系中地平面上的任一点,乘以H矩阵后都可以计算出真实三维空间下的坐标。
方案二:同样需要地面是平的假设,通过标定出相机的内参数和外参数,投影换算出图像地平面和三维空间的关系。

相机模型有哪些参数,写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种,对应畸变矫正的公式表达?

相机模型的内参数重要有:主点,焦距,畸变系数。
三维空间点到二维图像的投影公式:
在这里插入图片描述 镜头畸变:径向畸变和切向畸变。
径向畸变矫正公式表达:
在这里插入图片描述切向畸变矫正公式表达:
在这里插入图片描述

关于K-means聚类算法,请回答以下问题:

  1. K-means是有监督聚类还是无监督聚类?
  2. 写出将N个样本(X=(x1,…,xN))聚成K类的K-means聚类算法的优化目标函数。
  3. 请用伪代码写出聚类过程。
  4. 假设样本特征维度为D,请描述Kmeans算法时间复杂度。

1)无监督聚类
2)对于样本xi,计算其分类:
在这里插入图片描述
ci表示类别,uj表示质心
那么优化目标函数可以表示为:
在这里插入图片描述
N表示样本量,ui表示ci的质心
3)伪代码:
def Kmeans (输入数据,类簇的个数K):
初始计算K个质心点
repeat
计算数据中每个点到各个质心的距离,其中到质心距离最短的点被分为同一个簇,最后得到K个类簇
重新计算K个类簇的质心
until 知道所有样本的类簇不发生改变或达到最大迭代次数
4)假设数据量为N,数据维度为D,K为簇的个数,I为迭代次数,那么Kmeans算法的时间复杂度为:N×D×K×I

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值