测试数据科学家深度学习基础知识的 45 个问题(以及解决方案)

测试数据科学家深度学习基础知识的 45 个问题(以及解决方案)

在这里插入图片描述

一、介绍

早在2009年, 深度学习还只是一个新兴领域。只有少数人认为这是一个富有成效的研究领域。今天,它被用于开发应用程序,这些应用程序在一段时间前被认为是困难或不可能做到的。
语音识别、图像识别、在数据集中查找模式、照片中的对象分类、字符文本生成、自动驾驶汽车等等只是其中的几个例子。因此,熟悉深度学习及其概念非常重要。
在这次技能测试中,我们测试了我们的社区关于深度学习的基本概念。共有1070人参加了本次技能测试。

二、问题和答案

2.1 问题1.据说神经网络模型的灵感来自人脑。

在这里插入图片描述

神经网络由许多神经元组成,每个神经元接受输入,处理它并给出输出。这是一个真实神经元的图示。

在这里插入图片描述

以下哪项陈述正确地代表了真正的神经元?

A。神经元只有一个输入和一个输出
B.神经元有多个输入,但只有一个输出
C.神经元有单一输入但多个输出
D.神经元有多个输入和多个输出
E.以上所有陈述均有效
解决方案:(E)

一个神经元可以有一个输入/输出,也可以有多个输入/输出。

2.2 问题2.下面是神经元的数学表示。

在这里插入图片描述

神经元的不同成分表示为:

x1、x2,…,xN:这些是神经元的输入。这些值可以是来自输入层的实际观测值,也可以是来自其中一个隐藏层的中间值。
w1、w2,…,wN:每个输入的权重。
bi:称为偏置单位。这些是添加到对应于每个权重的激活函数输入中的常量值。它的工作原理类似于截获项。
a:称为神经元的激活,可以表示为
y:是神经元的输出
在这里插入图片描述
考虑到上述符号,直线方程(y = mx + c)是否属于神经元的范畴?
A.是的
B. 否
解决方案:(A)

没有非线性的单个神经元可以被认为是线性回归函数。

2.3 问题3.让我们假设我们对单个神经元实现一个 AND 函数。下面是 AND 函数的表格表示形式:

X1型X2系列X1 和 X2
000
010
100
111
我们神经元的激活函数表示为:

在这里插入图片描述
在这里插入图片描述

权重和偏差是多少?
(提示:对于w1、w2和b的哪些值,我们的神经元实现了AND函数?
A. 偏差 = -1.5,w1 = 1,w2 = 1
B. 偏差 = 1.5,w1 = 2,w2 = 2
C. 偏差 = 1,w1 = 1.5,w2 = 1.5
D. 这些都不是
解决方案:(A)

A。

f(-1.51 + 10 + 10) = f(-1.5) = 0
f(-1.5
1 + 10 + 11) = f(-0.5) = 0
f(-1.51 + 11 + 10) = f(-0.5) = 0
f(-1.5
1 + 11+ 11) = f(0.5) = 1
因此,选项A是正确的

2.4 问题4.当我们将多个神经元堆叠在一起时,就会创建一个网络。让我们以模拟 XNOR 函数的神经网络为例。

在这里插入图片描述
你可以看到,最后一个神经元从它之前的两个神经元接收输入。所有神经元的激活函数由下式给出:
在这里插入图片描述
假设 X1 为 0,X2 为 1,上述神经网络的输出是什么?
A. 0
B. 1
解决方案:(A)
a1 的输出:f(0.51 + -10 + -11) = f(-0.5) = 0
a2 的输出:f(-1.5
1 + 10 + 11) = f(-0.5) = 0
a3 的输出:f(-0.51 + 10 + 1*0) = f(-0.5) = 0
所以正确答案是A

2.5 问题5.在神经网络中,了解每个神经元的权重和偏差是最重要的一步。如果你能以某种方式得到每个神经元的正确的权重和偏差值,你就可以近似任何函数。解决这个问题的最佳方法是什么?

A. 分配随机值并向上帝祈祷它们是正确的
B.搜索权重和偏差的所有可能组合,直到获得最佳值
C. 在分配值后,迭代检查您与最佳值的距离,并稍微更改分配的值以使其更好
D. 这些都不是
解决方案:(C)
选项C是梯度下降的描述。

2.6 问题6. 使用梯度下降算法的步骤是什么?

计算实际值和预测值之间的误差
重复,直到找到最佳网络权重
通过网络传递输入并从输出层获取值
初始化随机权重和偏差
转到导致错误的每个神经元,并更改其各自的值以减少错误
答:1、2、3、4、5

B. 5、4、3、2、1

C. 3、2、1、5、4

D. 4、3、1、5、2

解决方案:(D)

选项D是正确的

2.7 问题7.假设输入为 x、y 和 z,值分别为 -2、5 和 -4。你有一个神经元 ‘q’ 和神经元 ‘f’ 的函数:

q = x + y
f = q * z
函数的图形表示如下:
在这里插入图片描述
F 相对于 x、y 和 z 的梯度是多少?
(提示:要计算梯度,必须找到 (df/dx)、(df/dy) 和 (df/dz))A。 (-3,4,4)

B.(4,4,3)
C.(-4,-4,3)
D.(3,-4,-4)
解决方案:(C)
选项C是正确的。

2.8 问题8.现在让我们修改前面的幻灯片。我们了解到:

神经网络是大脑的(粗略)数学表示,它由称为神经元的较小组件组成。
每个神经元都有一个输入、一个处理函数和一个输出。
这些神经元堆叠在一起形成一个网络,可用于近似任何功能。
为了获得最好的神经网络,我们可以使用梯度下降等技术来更新我们的神经网络模型。
上面给出的是神经网络的描述。 神经网络模型何时成为深度学习模型?

一个。当您添加更多隐藏层并增加神经网络的深度时B.当数据维度较高时
C.当问题是图像识别问题时
D. 这些都不是
解决方案:(A)
更深意味着网络更深。对于使模型深度需要多少层没有严格的规定,但是如果隐藏层超过 2 个,则模型被称为深度。

2.9 问题9. 神经网络可以被认为是堆叠在一起的多个简单方程。假设我们想复制下面提到的决策边界的函数。

在这里插入图片描述

使用两个简单的输入 h1 和 h2
在这里插入图片描述

最终的方程是什么?
A. (h1 和不是 h2) 或(不是 h1 和 h2)
B. (h1 或不是 h2) 和 (不是 h1 或 h2)
C. (h1 和 h2) 或 (h1 或 h2)
D. 这些都不是
解决方案:(A)
如您所见,以智能方式组合 h1 和 h2 可以轻松获得复杂的方程。请参阅本书的第 9 章

在查看下一个深度学习问题之前,请探索 Certified AI & ML Blackbelt+ Program!

2.10 问题10. “卷积神经网络可以在输入中执行各种类型的转换(旋转或缩放)”。该陈述是正确的 True 还是 False?

A. 对
B. 错

解决方案:(B)

在将数据提供给神经网络之前,必须执行数据预处理步骤(即旋转、缩放),因为神经网络无法自行完成。

2.11 问题11.以下哪种技术执行与神经网络中的辍学类似的操作?

A. 装袋B.提高

C. 堆垛

D. 这些都不是

解决方案:(A)

辍学可以看作是一种极端的袋装形式,其中每个模型都在一个案例上进行训练,并且通过与所有其他模型中的相应参数共享模型的每个参数来非常强地正则化。请参阅此处

2.12 问 12.以下哪项赋予神经网络非线性?

A. 随机梯度下降B.整流线性单元

C. 卷积函数

D. 以上都不是

解决方案:(B)

整流线性单元是一种非线性激活函数。

2.13 问题13. 在训练神经网络时,您会注意到损失在几个起始周期内不会减少。

在这里插入图片描述

造成这种情况的原因可能是:

学习率低
正则化参数高
卡在局部最小值
根据您的说法,可能的原因是什么?

A. 1 和 2
B. 2 和 3
C. 1 和 3
D. 其中任何一项
解决方案:(D)
由于上述任何原因,都可能发生该问题。

2.14 问题14.关于模型容量(其中模型容量是指神经网络近似复杂函数的能力),以下哪项是正确的?

一个。随着隐藏层数量的增加,模型容量也会增加

B.随着辍学率的增加,模型容量也会增加

C. 随着学习率的提高,模型容量也会增加

D. 这些都不是

解决方案:(A)

只有选项 A 是正确的。

2.15 问题15. 如果增加多层感知器中的隐藏层数,则测试数据的分类误差始终会减小。对还是错?

A. 正确B.假

解决方案:(B)

这并不总是正确的。过拟合可能会导致误差增加。

2.16 问题16. 您正在构建一个神经网络,其中它从前一层以及自身获取输入。

在这里插入图片描述
以下哪个体系结构具有反馈连接?
A. 递归神经网络
B. 卷积神经网络
C. 受限玻尔兹曼机
D. 这些都不是
解决方案:(A)
选项 A 是正确的。

2.17 问题17. 感知器中以下任务的顺序是什么?

随机初始化感知器的权重
转到下一批数据集
如果预测与输出不匹配,请更改权重
对于示例输入,计算输出
答:1、2、3、4B、4、3、2、1

C. 3、1、2、4

D. 1、4、3、2

解决方案:(D)

序列 D 是正确的。

2.18 问题18. 假设您必须通过更改参数来最小化成本函数。以下哪种技术可用于此目的?

A. 详尽搜索B.随机搜索

C. 贝叶斯优化

D. 其中任何一项

解决方案:(D)

上述任何一种技术都可用于更改参数。

2.19 问题19. 一阶梯度下降在以下哪个图中无法正常工作(即可能会卡住)?

A

在这里插入图片描述
B
在这里插入图片描述
C
在这里插入图片描述
答:B.
C.
D. 这些都不是
解决方案:(B)
这是梯度下降的鞍点问题的典型例子。

2.20 问题20.下图显示了经过训练的 3 层卷积神经网络与参数数量(即特征核的数量)的准确性。

在这里插入图片描述

该趋势表明,随着神经网络宽度的增加,精度会增加,直到达到某个阈值,然后开始降低。
这种下降的可能原因是什么?
A。即使内核数量增加,也只有少数内核用于预测
B.随着内核数量的增加,神经网络的预测能力下降
C.随着内核数量的增加,它们开始相互关联,这反过来又有助于过拟合
D. 这些都不是
解决方案:(C)
如选项 C 所述,可能的原因可能是内核相关性。

2.21 问题21.假设我们有一个隐藏层神经网络,如上所示。该网络中的隐藏层用作降维器。现在,我们不再使用这个隐藏层,而是用PCA等降维技术代替它。

在这里插入图片描述

使用降维技术的网络是否总是给出与具有隐藏层的网络相同的输出?
A. 是的
B.不
解决方案:(B)
因为 PCA 适用于相关特征,而隐藏层适用于特征的预测能力。

2.22 问题22.神经网络可以对函数进行建模吗 (y=1/x)?

A. 是的
B.不
解决方案:(A)
选项 A 为 true,因为激活函数可以是倒数函数。

2.23 问题23.在哪种神经网络架构中,权重共享会发生?

A. 卷积神经网络
B.递归神经网络
C. 全连接神经网络
D. A 和 B
解决方案:(D)
选项D是正确的。

问题24.批量规范化很有帮助,因为

A。它会在将所有输入发送到下一层
B 之前对其进行规范化(更改)。它返回权重的归一化平均值和标准差
C.这是一种非常有效的反向传播技术
D. 这些都不是
解决方案:(A)
要了解有关批量规范化的更多信息,请参阅此视频

问题25.我们没有试图实现绝对零误差,而是设置了一个称为贝叶斯误差的指标,这是我们希望实现的误差。使用贝叶斯错误的原因可能是什么?

A. 输入变量可能不包含有关输出变量
B 的完整信息。系统(创建输入-输出映射)可能是随机的
C. 有限的训练数据
D. 以上所有
解决方案:(D)
实际上,实现准确的预测是一个神话。因此,我们应该希望取得“可实现的结果”。

问题26.输出层中的神经元数应与监督学习任务中的类数(类数大于 2)匹配。对还是错?

A. 正确B.假
解决方案:(B)
这取决于输出编码。如果它是单热编码,那么它是真的。但是,您可以为四个类提供两个输出,并将二进制值作为四个类 (00,01,10,11)。

问题27.在神经网络中,以下哪种技术用于处理过拟合?

A. 辍学B.正规化
C. 批量归一化
D. 所有这些
解决方案:(D)
所有技术都可用于处理过拟合。

问题28. Y = ax^2 + bx + c(2 次多项式方程)

这个方程可以用具有线性阈值的单个隐藏层的神经网络来表示吗?
A. 是的B.不
解决方案:(B)
答案是否定的,因为线性阈值限制了神经网络,简单来说,就是一个相应的线性变换函数。

问题29.什么是神经网络中的死单元?

一个。在训练期间不由其任何邻居 B 更新的单位。对任何训练模式都不完全响应的单元
C. 产生最大和平方误差的单位
D. 这些都不是
解决方案:(A)
选项 A 是正确的。

问题30.以下哪项陈述是对提前停止的最佳描述?

A. 训练网络,直到达到错误函数中的局部最小值
B. 在每个训练周期后在测试数据集上模拟网络。当泛化误差开始增加时停止训练
C. 在广义增量规则中的权重更新中添加一个动量项,以便训练更快地收敛
D. 更快的反向传播版本,例如“Quickprop”算法
解决方案:(B)
选项B是正确的。

问题31.如果我们使用的学习率太大怎么办?

A. 网络将收敛B.网络不会收敛
C. 不能说
解决方案:B
选项 B 是正确的,因为错误率会变得不稳定并爆炸。

2.32 问题32.图 1 所示的网络经过训练,可以识别字符 H 和 T,如下所示:

在这里插入图片描述

网络的输出是什么?
在这里插入图片描述
可以是 A 或 B,具体取决于神经网络的权重
解决方案:(D)
如果不知道神经网络的权重和偏差是什么,我们就无法评论它会给出什么输出。

问题33.假设卷积神经网络是在 ImageNet 数据集(对象识别数据集)上训练的。然后,为这个经过训练的模型提供一个完全白色的图像作为输入。对于所有类,此输入的输出概率都相等。对还是错?

A. 正确B.假
解决方案:(B)
会有一些神经元不会激活白色像素作为输入。所以类不会相等。

问题34.在卷积神经网络中添加池化层时,将保留平移方差。对还是错?

A. 正确B.假
解决方案:(A)
使用池化时会诱发平移不变性。

问题35.当数据太大而无法同时在RAM中处理时,哪种梯度技术更有优势?

A. 全批次梯度下降B.随机梯度下降
解决方案:(B)
选项B是正确的。

问题36.该图表示一个四隐藏层神经网络的梯度流,该神经网络使用每集训练的 sigmoid 激活函数进行训练。神经网络受到梯度消失问题的困扰。

在这里插入图片描述

以下哪项说法是正确的?
A.隐藏层1对应D层,隐藏层2对应C层,隐藏层3对应B层,隐藏层4对应A层
B.隐藏层1对应A,隐藏层2对应B,隐藏层3对应C,隐藏层4对应D层
解决方案:(A)
这是对梯度消失问题的描述。当反向传播算法进入起始层时,学习会减少。

问题37.对于分类任务,我们将所有权重设置为零,而不是神经网络中的随机权重初始化。以下哪项说法是正确的?

一个。不会有任何问题,神经网络会正确训练B。神经网络将进行训练,但所有神经元最终都会识别出同样的东西
C. 神经网络不会训练,因为没有净梯度变化
D. 这些都不是
解决方案:(B)
选项B是正确的。

问题38.开始时有一个高原。发生这种情况是因为神经网络在进入全局最小值之前卡在局部最小值。

在这里插入图片描述

为了避免这种情况,以下哪种策略应该有效?
A. 增加参数数量,因为网络不会卡在局部最小值
B.开始时将学习率降低10倍,然后使用动量
C. 抖动学习率,即改变几个时期的学习率
D. 这些都不是
解决方案:(C)
选项 C 可用于将神经网络从它所处的局部最小值中取出。

问题39.对于图像识别问题(识别照片中的猫),哪种神经网络架构更适合解决问题?

A. 多层感知器B.卷积神经网络
C. 递归神经网络
D. 感知器
解决方案:(B)

卷积神经网络将更适合于与图像相关的问题,因为它固有的特性可以考虑图像附近位置的变化

问题40. 假设在训练时遇到此问题。经过几次迭代后,错误突然增加。

在这里插入图片描述

您确定数据一定有问题。您绘制数据并发现原始数据有些偏斜,这可能会导致问题。
在这里插入图片描述

您将如何应对这一挑战?
A. 规范化
B. 应用 PCA,然后进行归一化
C. 对数据进行日志转换
D. 这些都不是
解决方案:(B)
首先,您将删除数据的相关性,然后将其归零。

问题41.以下哪项是神经网络的决策边界?

在这里插入图片描述

A) B
B)A
C) D
D) C
E) 所有这些
解决方案:(E)

神经网络被称为通用函数逼近器,因此理论上它可以表示任何决策边界。

问题42.在下图中,我们观察到误差有许多“起伏”

在这里插入图片描述

我们应该担心吗?
A. 是的,因为这意味着神经网络的学习率存在问题。
B. 不,只要训练和验证误差都累积减少,我们就不用担心。
解决方案:(B)
选项B是正确的。为了减少这些“起伏”,请尝试增加批量大小。

问题43. 选择神经网络深度的因素有哪些?

神经网络的类型(例如。MLP、 CNN等)
输入数据
计算能力,即硬件能力和软件能力
学习率
要映射的输出函数
答:1、2、4、5
B. 2、3、4、5
C. 1、3、4、5
D. 所有这些
解决方案:(D)
以上所有因素对于选择神经网络的深度都很重要

问题44.考虑一下这个场景。您尝试解决的问题具有少量数据。幸运的是,你有一个预先训练的神经网络,它是针对类似的问题训练的。您会选择以下哪种方法来利用这个预训练网络?

A. 为新数据集重新训练模型B.在每一层上评估模型的性能,并仅选择其中的几个
C. 仅微调最后几层
D. 冻结除最后一层之外的所有层,重新训练最后一层
解决方案:(D)
如果数据集基本相似,最好的方法是只训练最后一层,因为之前的所有层都用作特征提取器。

问题45.卷积核大小的增加必然会提高卷积网络的性能。

A. 正确B.假
解决方案:(B)
增加内核大小不一定会提高性能。这在很大程度上取决于数据集。

三、结束语

我希望您喜欢参加测试,并且发现解决方案很有帮助。该测试侧重于深度学习的概念知识。
我们试图通过本文消除您的所有疑虑,但如果我们错过了某些内容,请在下面的评论中告诉我。如果您认为我们应该在下一次技能测试中提出任何建议或改进,请在评论部分留下您的反馈,告诉我们。

  • 15
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

无水先生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值