深度学习（计算机视觉）面试问题：

最新推荐文章于 2024-09-18 14:44:31 发布

xxnote

最新推荐文章于 2024-09-18 14:44:31 发布

阅读量5.3k

点赞数 3

深度学习（计算机视觉）面试问题：
转载原文：https://blog.csdn.net/comway_Li/article/details/82532573
1.1*1卷积的作用：
答：1.实现跨通道的交互和信息整合2.进行卷积核通道数的降维和升维3.实现多个feature map的线性组合，实现通道个数的变换4.对特征图进行一个比例缩放

2.CNN池化层有什么作用？
答：1、减小图像尺寸，数据降维。2、缓解过拟合。3、保持一定程度的旋转和平移不变性，maxpooling能保证卷积神经网络在一定范围内平移特征能得到同样的激励，具有平移不变性。

3.空洞卷积的作用是什么？
答:空洞卷积也叫扩张卷积，在保持参数个数不变的情况下增加了卷积核的感受野，同时它可以保证输出的特征映射（feature map）的大小保持不变。一个扩张率为2的3x3卷积核，感受野与5x5的卷积核相同，但参数个数量仅为9个。

4.深度学习中常用的损失函数？
答：交叉熵损失，平方差损失，绝对值损失，Hinge Loss。

5、 Sigmoid激活函数为什么会出现梯度消失？Sigmoid函数导数的最大值出现在哪个值？
答：为什么会出现梯度消失，从两方面来看，首先先看本身函数，若输入值X过大，sigmoid函数导数为零，第二方面：sigmoid函数求导，导数最大是等于1/4，小于1，经过深的网络传递就会出现梯度消失的问题。
在x=0时导数最大

6.评价指标有哪些？
答、机器学习中评价指标： Accuracy（准确率）、 Precision（查准率或者精准率）、Recall（查全率或者召回率）。
目标检测的指标：识别精度，识别速度，定位精度。
a、目标检测中衡量识别精度的指标是mAP（mean average precision）。多个类别物体检测中，每一个类别都可以根据recall和precision绘制一条曲线，AP就是该曲线下的面积，mAP是多个类别AP的平均值。
b、目标检测评价体系中衡量定位精度的指标是IoU,IoU就是算法预测的目标窗口和真实的目标窗口的交叠（两个窗口面积上的交集和并集比值）

7.深度学习训练时网络不收敛的原因有哪些？如何解决？
答：不收敛一般都是数据不干净，学习率设置不合理，网络等问题

8.如何应对图像光照变化大？
答：1、直方图均衡化
2、对比度拉伸，或者调节
3、若受光源影响，使得图片整体色彩往一方面移动，用白平衡算法进行修正，使其发黄、发蓝、发红的照片更加趋于自然光下的图像
4、若是过爆或者过暗，可是设计阈值函数，不用全局阈值，对特定区域进行特定阈值分割。
5、若是太暗，可以采用对数变化，对数图像增强是图像增强的一种常见方法，其公式为： S = c log(r+1)，对数使亮度比较低的像素转换成亮度比较高的，而亮度较高的像素则几乎没有变化，这样就使图片整体变亮。
6、采用拉普拉斯算子增强，
filter2D(src,dst)

9、常用的分割方法有哪些？
答：1、基于阈值的分割方法：比较常用的阂值法有大律法、最小误差法
2、基于边缘的分割方法：常见的微分算子包括Robert算子、Prewitt算子、Sobel算子、Laplaeian算子、Canny算子等
3、基于区域的分割方法：主要包括种子区域生长法、区域分裂合并法和分水岭法等几种类型。
4、基于图论的分割方法：Graph Cut方法
5、深度学习：语义分割等

10.深度学习为什么要这么深？

11.如何解决数据不平衡问题：
答：1、利用重采样中的下采样和上采样，对小数据集类别分别采用上采样，通过复制来增加数据，不过这种情况容易出现过拟合，建议用数据扩增的方法，对原有数据集进行翻转，旋转，平移，尺度拉伸，对比度，亮度，彩色变化来增加数据。对大数据类别剔除一些样本量。
2.组合不同的重采样数据集：假设建立十个模型，选取小数据类1000个数据样本，然后将大数据类别10000个数据样本分为十份，每份为1000个，并训练十个不同的模型。
3、更改分类器评价指标：在传统的分类方法中，准确率是常用的指标。然而在不平衡数据分类中，准确率不再是恰当的指标，采用精准率即查准率P：真正例除以真正例与假正例之和。召回率即查全率F：真正例除以真正例与假反例之和。

12.对于训练集与验证集测试集分布不同的处理办法
答：1、若训练集与验证集来自不同分布，比如一个网络爬虫获取的高清图像，一个是手机不清晰图像，人工合成图像2、两种来源的数据，一个来源数据大比如20万张，一个来源数据小，比如五千张。小数据集是我们优化目标。一种情况是将两组数据合并在一起，然后随机分配到训练验证测试集中，好处是，三个数据集来自同一分布。缺点：瞄准目标都是大数据那一类的数据，而不是我们的目标小数据集。另外一种情况是训练集全部用大数据集，开发与测试都是小数据集，有点：瞄准目标，坏处是不同分布。

13.如何改善训练模型的效果呢？
答：1、通过提升数据，获取良好的数据。对数据预处理；零均值1方差化，数据扩充或者增强
2.诊断网络是否过拟合
3.通过学习率、激活函数的选择，改善网络全连接层个数，优化算法，随机梯度，RMPSprop,动量，adam,使用bachnormlization.
4.权值初始化Xavier初始化，保持输入与输出端方差一致，避免了所有输出都趋向于0；
发士大夫在这里插入图片描述

在这里插入图片描述
14.如何解决梯度爆炸与消失
答：1、预训练加微调梯度剪、权重正则
2.使用不同的激活函数3、使用bachnorm4、使用残差结构5、使用LSTM网络

15.为什么要使用许多小卷积核（如3x3）而不是几个大卷积核？

16.为什么在图像分割中CNNs通常具有编码器-解码器结构？
编码器CNN基本上可以被认为是特征提取网络，而解码器使用该信息通过“解码”特征并放大到原始图像大小来预测图像分割区域。

17.为什么我们对图像使用卷积而不仅仅是FC层？

18.什么是数据正则化\归一化（normalization）？为什么我们需要它？
答：数据归一化是非常重要的预处理步骤，用于重新缩放输入的数值以适应特定的范围，从而确保在反向传播期间更好地收敛。一般来说采取的方法是减去每个数据点的平均值并除以其标准差。如果不这样做，那么一些特征（那些具有高幅值）将在cost函数中得到更大的加权，（如果较高幅值的特征改变1%，则改变相当大，但是对于较小的特征，改变相当小）。

19.解释降维（dimensionality reduction），降维在哪里使用，降维的好处是什么？
降维是通过获得一组基本上是重要特征的主变量来减少所考虑的特征变量的过程。特征的重要性取决于特征变量对数据信息表示的贡献程度。好处：1减少所需的存储空间2.加快计算速度3.将数据的维数降低到2D或3D可以允许我们绘制和可视化它，给我们提供直观感受。4.太多的特征或太复杂的模型可能导致过拟合。