CV面试题

日萌社

人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新)


1,计算机视觉在工农业生产、地质学、天文学、气象学、医学及军事学等领域有着极大的潜在应用价值,
所以它在国际上越来越受人重视。下列选项中哪项不是计算机视觉的应用?(C)

A. 零件识别与定位  B. 机器人对话系统优化 C.移动机器人导航  D. 医学图像分析


2,人工标注框的重合度IOU(Intersection Over Union)指的是程序预测框与人工标注边界框重合的面积和总面积的比值,
从而判断其识别的精准程度,假设程序预测区域为A,人工标注区域为B,那么IOU应如何表示?(B)

A.IOU=(A∩B)*(A∪B)  B. IOU=(A∩B)/(A∪B) C. IOU=(A∩B)/A  D.IOU=(A∩B)/B


3,关于CNN中的卷积核的理解,错误的是(A):

A.AlexNet 中用到了一些非常大的卷积核,比如 11×11、5×5 卷积核,卷积核越大,
receptive field(感受野)越大,看到的图片信息越多,因此获得的特征越好,因此,卷积核应该越大越好
B.3×3 卷积核被广泛应用在各种模型中
C.多个小的卷积核叠加使用要远比一个大的卷积核单独使用效果要好的多,在连通性不变的 情况下,
大大降低了参数个数和计算复杂度
D.卷积核也不是越小越好,对于特别稀疏的数据,当使用比较小的卷积核的时候可能无法表示其特征,
如果采用较大的卷积 核则会导致复杂度极大的增加。总而言之,我们应该选择多个相对小的卷积核来进行卷积


4,手机拍照功能一般会把人脸用边界框框出来,这个工作在计算机视觉任务中属于以下哪个选项?(D)

A.图像分类  B. 图像复原 C. 画面拼接  D.目标检测


5,算子在图像处理领域主要用于边缘检测,下列算子中属于基于二阶导数的边缘算子为:(D)

A.Robert算子  B. Sobel算子 C. Prewitt算子  D.Laplacian算子


6,关于图像锐化,下列描述不正确的是(D):

A.图像锐化,常用的做法是提取图像的高频分量,将其叠加到原图上
B.图像高频分量的提取有两种做法,一种是用高通滤波器,得到高频分量,另一种是通过低通滤波,
用原图减低频得以高频。
C.sobel算子是图像的一阶导数,提取的是梯度信息,分水平和垂直两种,常常用来做边缘检测、方向判别,
sobel算子在斜坡处不为0,因此会产生较粗的边缘。
D.平滑是把图像变清晰;锐化是把图像变模糊;
 

7,在图像识别中,往往有多种标签,根据标签数目有以下分类。多分类任务:只有一个标签,
但是标签有多种类别;多标签分类任务:一条数据可能有一个或者多个标签,比如一个病人的眼底检测报告,
它可能被标记患有糖尿病、高血压多个标签。以上任务在深度学习算法中说法正确的是:(A)

A.多分类任务一般采用softmax作为输出层的激活函数,用categorical_crossentropy作为损失函数。
B.多分类任务一般采用sigmoid作为输出层的激活函数,用binary_crossentropy作为损失函数。
C.多标签分类任务一般采用softmax作为输出层的激活函数,用categorical_crossentropy作为损失函数
D.多标签分类任务一般采用sigmoid作为输出层的激活函数,用categorical_crossentropy作为损失函数

8,以下哪个选项不属于图像处理中常用的特征提取算法:(D)

A.SIFT(尺度不变特征变换)  B. HOG(方向梯度直方图) C. Haar  D. SVM(支持向量机)


9,下列哪个选项不属于常见的池化方法(D)?

A.平均池化  B.最大池化 C.空间金字塔池化  D.全连接池化


10,Relu 激活函数图像如下,关于Relu的表述,错误的有:(C)?

A.ReLU 函数从图像上看,是一个分段线性函数,把所有的负值都变为 0,而正值仍然为正,这样就成为单侧抑制 
B.当 x<0 时,ReLU 硬饱和,而当 x>0 时,则不存在饱和问题。ReLU 能够在 x>0 时保持梯度不衰减,
从而缓解梯度消失问题 
C.使得神经网络线性拟合,同时神经元也具有了稀疏激活性  
D.和Sigmoid激活函数不同,Relu不容易出现饱和问题

 

11,下列关于计算机视觉与图像处理及计算机图形学的说法不正确的是:(D)

A.Photoshop中对一幅图像应用滤镜就是典型的一种图像处理
B.计算机图形学是借助计算机来研究图形表达、处理图像的学科
C.图像处理的研究对象主要是二维图像,用来提高图像对比度、去噪声等,其研究内容与图像的具体内容无关
D.计算机视觉的研究很大程度上与图像的具体内容无关


12,CNN池化层的作用,描述不正确的是(D):

A. 减小图像尺寸,数据降维
B. 缓解过拟合
C. 使图像保持一定程度的旋转和平移不变性
D. 增加神经网络的参数数量


1,GoogLeNet采用了模块化的结构(Inception结构),Inception历经了V1、V2、V3、V4等多个版本的发展,不断趋于完善,请写出3条以上V1-V4演进中的变化:

1,Inception V4 相比 V3 主要是结合了ResNet,加入残差思想将错误率进一步减少
2,Inception V3继续分解卷积,1xn+nx1代替nxn进一步减少参数,将7x7分解成两个一维的卷积(1x7,7x1),3x3也是一样(1x3,3x1),这样的好处,既可以加速计算,又可以将1个卷积拆成2个卷积,使得网络深度进一步增加,增加了网络的非线性。
3,Inception V2卷积分解,两个3x3代替5x5,即在保持感受野范围的同时又减少了参数量
4,Inception V1多尺度融合,将CNN中常用的卷积(1x1,3x3,5x5)、池化操作(3x3)堆叠在一起(卷积、池化后的尺寸相同,将通道相加),一方面增加了网络的宽度,另一方面也增加了网络对尺度的适应性。

2,请分别描述SURF,SIFT,ORB,开运算,闭运算上述五种操作的特点及功能。

1,SIFT即尺度不变特征变换,是一种计算机视觉的特征提取算法,描述子使用在关键点尺度空间内44的窗口中计算的8个方向的梯度信息,共44*8=128维向量表征。
2,SURF也是一种类似于SIFT的兴趣点检测及描述子算法。其通过Hessian矩阵的行列式来确定兴趣点位置,再根据兴趣点邻域点的Haar小波响应来确定描述子,其描述子大小只有64维。
3,ORB其运行时间远远优于SIFT和SURF,可应用于实时性特征检测。ORB特征检测具有尺度和旋转不变性,对于噪声及其透视变换也具有不变性。
4,开运算:先腐蚀运算,再膨胀运算,把细微连在一起的两块目标分开了,开运算能够除去孤立的小点,毛刺和小桥,而总的位置和形状不变。
5,闭运算:先膨胀运算,再腐蚀运算,将两个细微连接的图块封闭在一起,闭运算能够填平小湖(即小孔),弥合小裂缝,而总的位置和形状不变。

3,光圈越大,摄取的画面是否越亮?光圈的数字越小是否代表光圈越小?2.8 的光圈与 5.6 的光圈,哪个画面更亮?光圈越小,画面是否越有立体感? 

答:光圈越大,光学镜头进光量越大,摄取的画面也越亮。光圈系数(F)反映镜头的通 
光量,以焦距 f 和通光孔径 D 表示。通光量与 F 值的平方成反比。所以光圈的数字越小代表 光圈越大。2.8 的光圈比 5.6 的光圈更亮。景深(depth of field)是对某景物调焦,以形成前后清晰区域。景深与三个因素有关:光圈、焦距和物距。光圈越小,景深越深。 

4,摄像机和数码相机分辨率受到哪些因素限制?是否越高越好?如何进一步提高分辨率?

答:分辨率往往是用户最关心的指标,但其上限受到像素极限尺寸、CCD 制造工艺、设 
备性价比等因素限制,并不能无限提高。人们正在研究采用信号处理的超分辨率技术力求解 
决这些问题。

5,扫描仪的光学分辨率是 600×1200 线,一个具有 5000 个感光单元的 CCD 器件,用于 A4 幅面扫描仪,A4 幅面的纸张宽度是 21 cm,该扫描仪的光学分辨率是多少 dpi?

解:(1)600×1200 线,其中前一个数字代表扫描仪的横向分辨率,后一数字则代表纵 
向分辨率。(2)dpi 是指单位面积内像素的多少,也就是扫描精度 ,目前国际上都是计算一英寸面积内像素的多少。光学分辨率是扫描仪的光学部件在每平方英寸面积内所能捕捉到的实际的光点数,是指扫描仪 CCD 的物理分辨率,也是扫描仪的真实分辨率,它的数值是由 CCD 的像素点除以扫描仪水平最大可扫尺寸得到的数值。 
每一个感光单元对应一个像素。由于 CCD 感光单元个数为 5000,21 cm = 8.3 英寸,所 
以该扫描仪的光学分辨率是 5000/8.3 = 602 dpi,规格化为 600 dpi。

6,试述中值滤波的特点。为什么对一些细节多,特别是点、线、尖点细节多的图像不适 宜用这种方法?

答:中值滤波便属于这一类的非线性增强方法,在去噪的同时可以兼顾到边界信息的保留。 
对消除孤立点和线段脉冲等干扰及图像扫描噪声最为有效,但对于消除高斯噪声的影响效果 
不佳。 
中值滤波首先选一个含有奇数点的窗口 W,将这个窗口在图像上扫描,把该窗口中所含 
的像素点按灰度级的升(或降)序排列,取位于中间的灰度值,来代替该点的灰度值。 
二维中值滤波的窗口形状和尺寸对滤波性能的影响较大,以适应不同的图像内容和应用 
要求。由于采用窗口中灰度值排序的方法决定中值,对于一些细节较多的复杂图像排序后将 
会影响正常图像的内容,所以不宜采用这种方法。 

7,基于数学形态学的图像处理有何特点? 

答:利用数学形态学进行图像处理有其独有的一些特性: 
(1)它反映的是一幅图像中像素点间的逻辑关系,而不是简单的数值关系。 
(2)它是一种非线性的图像处理方法,并且具有不可逆性。 
(3)它可以并行实现。 
(4)它可以用来描述和定义图像的各种集合参数和特征。

8,色调、色饱和度和亮度的定义是什么?在表征图像一点颜色时,各起什么作用?

答:HSV 模型由色度(H),饱和度(S),亮度(V)三个分量组成的,与人的视觉特 
性比较接近。HSV 颜色模型用 Munsell 三维空间坐标系统表示。 
色调(H)表示颜色的种类,用角度来标定,用-1800~1800 或 00~3600 度量。 
色饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比 
来度量,从 0%到完全饱和的 100%。 
亮度(V)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从 0%(黑) 
到 100%(白)。 

9,当 R = 0,G = 0,B = 1 时,在 HSI 空间求 H 和 S 值。

H = 2π-arccos(-1/2) = 4.189 (rad), S = 1, I= 1/3 

10,哪个颜色空间最接近人的视觉系统的特点?

答:在许多实用系统中,大量应用的是 HSV 模型,这个模型是由色度(H),饱和度(S), 
亮度(V)三个分量组成的,与人的视觉特性比较接近。该模型的重要性在于:一方面消除 
了亮度成分 V 在图像中与颜色信息的联系,另一方面色调 H 和饱和度 S 分量与人的视觉感 受密切相关。基于人的视觉系统的颜色感觉特性,这些特征使 HSV 模型成为一个研究图像 处理的重要工具。

11,常用的图像的几何特征包括哪些?

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

あずにゃん

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值