答案见下方
1.当输入从第8个mini-batch的第7个的例子的时候,你会用哪种符号表示第3层的激活?
A.a^ [3]{8}(7)
B.a^ [8]{7}(3)
C.a^ [8]{3}(7)
D.a^ [3]{7}(8)
2. 关于mini-batch的说法哪个是正确的?
A.mini-batch迭代一次(计算1个mini-batch),要比批量梯度下降迭代一次快
B.用mini-batch训练完整个数据集一次,要比批量梯度下降训练完整个数据集一次快
C.在不同的mini-batch下,不需要显式地进行循环,就可以实现mini-batch梯度下降,从而使算法同时处理所有的数据(矢量化)
3.为什么最好的mini-batch的大小通常不是1也不是m,而是介于两者之间?
A.如果mini-batch的大小是1,那么在你取得进展前,你需要遍历整个训练集
B.如果mini-batch的大小是m,就会变成批量梯度下降。在你取得进展前,你需要遍历整个训练集
C.如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处
D.如果mini-batch的大小是m,就会变成随机梯度下降,而这样做经常会比mini-batch慢
4.如果你的模型的成本J随着迭代次数的增加,绘制出来的图如下,那么:
<