一、选择题
选择题总共5个,每个3分。整体来说不难,主要是一些计算机视觉的基础题,但是如果看过时间太久了可能就忘记了,考前复习很有必要呀,我是没戏了。
1、图像边缘检测的卷积核是什么样的形式?
Roberts,Sobel,Prewitt,LOG,Canny
2、图像去噪滤波的方式有哪些?
3、哪些排序算法的时间复杂度为 O ( n ⋅ l o g n ) O(n\cdot log_{n}) O(n⋅logn)?
4、影响相机内参的因素有哪些?
焦距(fx 和 fy),中心像素坐标(u0和v0),坐标轴倾斜系数s,以及径向畸变系数(k1,k2,k3)和切向畸变系数(p1,p2)。
5、【不记得了】
二、填空题
填空题总共9个,每个5分。填空题我个人感觉就有点难了,可能是面向不同人的题吧,面还是比较广的,问题基本上都见过,在论文、博客什么的都研究过也看过,但是直接在笔试的时候凭脑子写,好吧我认输,自己还是太菜。。。只有几个题还会写一点。
1、计算空间中点到直线的距离。
我想了想应该是用叉积就可以了:直线 l l l 是过零点,其方向向量表示为: n ⃗ l = ( x 0 , y 0 , z 0 ) \vec n_{l}=(x_{0},y_{0},z_{0}) nl=(x0,y0,z0),点就是空间一点 a ( x i , y i , z i ) a(x_{i},y_{i},z_{i}) a(xi,yi,zi),将其表示为起于零点的向量 a ⃗ = ( x i , y i , z i ) \vec{a}=(x_{i},y_{i},z_{i}) a=(xi,yi,zi),则点 a a a 到直线 l l l 的距离表示为 d = n ⃗ l × a ⃗ d=\vec n_{l}\times \vec{a} d=nl×a。
2、正态分布相关问题。
设 X 1 , ⋅ ⋅ ⋅ , X m X_{1},\cdot \cdot \cdot,X_{m} X1,⋅⋅⋅,Xm来自于总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^{2}) X∼N(μ,σ2)的样本,则 E ( σ m 2 ) = ? E(\sigma ^{2}_{m})=? E(σm2)=?
解答: E ( X ˉ ) = μ , D ( X ˉ ) = σ 2 m E(\bar{X})=\mu , D(\bar{X})=\frac{\sigma^{2}}{m} E(Xˉ)=μ,D(Xˉ)=mσ2,则 E ( σ m 2 ) = σ 2 E(\sigma^{2}_{m})=\sigma^{2} E(σm2)=σ2
3、图像识别中的几种特征描述子。
这个问题是很简单的,只要看过几篇论文,几篇博客就知道了,而且确实很多。
∙ \bullet ∙斑点检测类:DOG , LOG , SIFT , SURF;
∙ \bullet ∙焦点检测类:Harris , FAST ;
∙ \bullet ∙二进制类:BRIEF , BRISK , ORB .
等等,这类比较多,随便写。
- 顺便说一下三维的,也方便自己记忆
三位识别方面的描述子主要分为局部特征描述子和全局特征描述子。
局部特征描述子:
- PFH (Point Feature Histogram) (点特征直方图)
- FPFH (Fast Point Feature Histogram) (快速点特征直方图) ,
- RSD (Radius-Based Surface Descriptor) (半径表面描述子) ,
- 3DSC (3D Shape Context) (3D形状上下文) ,
- USC (Unique Shape Context) (唯一形状上下文) ,
- SHOT (Signatures of Histogram Orientations) (方向签名直方图) ,
- Spin Image (旋转图) ,
- RIFT (Rotation-Invariant Feature Transform) (旋转不变特征变化) ,
- NARF (Normal Aligned Radial Feature) (法线对齐半径特征);
- RoPS (Rotation Projection Statistics) (旋转投影统计)
全局特征描述子:
- VFH (Point Feature Histogram) (点特征直方图)
- CVFH (Fast Point Feature Histogram) (快速点特征直方图) ,
- OUR-CVFH (Radius-Based Surface Descriptor) (基于半径的表面描述子) ,
- ESH (3D Shape Context) (3D形状上下文) ,
- GFPFH (Global Fast Point Feature Histogram) (全局快速点特征直方图)
- GRSD (Global Radius-Surface Descriptor) (全局半径表面描述子)
表格表示
图源[1]。
注:
+标有星号()的值表示描述符的大小取决于某些参数,给定的值是默认值。
++没有星号()的是自定义PointType的描述符,使用通用的“pcl :: Histogram <>”类型。
4、相机M1坐标系到相机M2坐标系的变换。
5、旋转矩阵的几种表示方式
题目给出了3X3的旋转矩阵(Rotation Matrix)形式,
其他的还有:EA : 欧拉角(Euler Angle),
RV : 旋转向量(Rotation Vector),
AA : 轴角(Axis-Angle),
Q : 四元数(Quaternion)
DCM : 方向余弦矩阵(Direction Cosine Matrix)–类似于旋转矩阵
6、【忘记了】
7、【忘记了】
8、【忘记了】
9、【忘记了】
三、解答题
1、卷积操作。
给定一个800x800大小的网络,3通道,卷积核size为3x3,stride为1,padding为1,pooling为max pooling,经过几次操作,得到的特征层维度?每个区域感受野?
2、k-means算法相关问题。
优点:易于实现
缺点:可能收敛于局部最小值,在大规模数据收敛慢
3、双目视觉相机baseline与测距极限的关系。
两个相机的焦距都为f,成像最小分辨率为两个像素
·根据视差计算原理
图中: O L , O R O_L ,O_R OL,OR ——左右光心;
P L , P R P_L,P_R PL,PR —— 左、右相机平面上关于三维空间中点 P P P 的像点;
u L , u R u_L,u_R uL,uR —— 左、右成像平面上像点的坐标,这里 u R u_R uR 为负数;
f f f —— 相机焦距;
b b b —— 左右相机之间的基线(Baseline);
z z z —— 三维空间中点 P P P 到相机光心平面的深度值。
左右像素的几何关系为: △ P O L O R ∼ △ P P L P R \triangle P O_L O_R \sim\triangle P P_L P_R △POLOR∼△PPLPR,于是可得
z − f z = b − ( u L ) − ( − u R ) b = b − u L + u R b \frac{z - f}{z} = \frac{b - (u_L)-(-u_R)}{b} = \frac{b - u_L + u_R}{b} zz−f=bb−(uL)−(−uR)=bb−uL+uR
又有左右图像的视差(Disparity)d:
d = ∣ u L ∣ + ∣ u R ∣ = u L − u R d = |u_L| + |u_R| = u_L - u_R d=∣uL∣+∣uR∣=uL−uR
于是可以整理得到:
z = b f d z = \frac{bf}{d} z=dbf
根据以上推理结果可以得出:
——视差越大,观测距离越近;
——基线越宽,观测距离越远;
——视差计算困难,计算量和精度是关键难点。
引用参考
[1] 文中图片来源