Machine Learning Week 1 Quiz 2 (Linear Regression with One Variable) Stanford Coursera_错题汇总

最新推荐文章于 2022-02-11 11:50:57 发布

从心所欲0

最新推荐文章于 2022-02-11 11:50:57 发布

阅读量845

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/follow_own_heart/article/details/82254472

版权

1 篇文章 0 订阅

订阅专栏

1。

设f是某种功能所以

f（θ0，θ1）输出一个数字。对于这个问题，

f是一些任意/未知的平滑函数（不一定是

线性回归的成本函数，因此f可能具有局部最优）。

假设我们使用梯度下降来尝试将f（θ0，θ1）最小
化为θ0和θ1的函数。哪一个

以下陈述是真的吗？（检查所有适用。）

回答：

对或错	声明	说明
真正	如果学习速率太小，则梯度下降可能需要很长时间才能收敛。	如果学习率太小，梯度下降的每一步都只有很小的补偿，因此需要很长时间去收敛
真正	如果θ0和θ1初始化为局部最小值，则一次迭代不会改变它们的值。	在局部最小时，梯度为零，因此不会改变参数的值
假	即使学习率α非常大，梯度下降的每次迭代都会减小f（θ0，θ1）的值。	如果学习率太大，迭代会越过局部最小值，可能会导致增加F（θ0，θ1）
假	如果θ0和θ1被初始化使得θ0=θ1，那么通过对称性（因为我们同时更新两个参数），在梯度下降的一次迭代之后，我们仍将具有θ0=θ1。	θ0和θ1的公式是不同的，就算初始值相同，在一次迭代之后也不一定相同

其他选择：

对或错	声明	说明
真正	如果渐变下降的前几次迭代导致f（θ0，θ1）增加而不是减少，则最可能的原因是我们将学习速率设置为过大的值	与第三选项同理
假	无论θ0和θ1如何初始化，只要学习率足够小，我们就可以安全地预期梯度下降会聚到同一解决方案	这不是真的，取决于初始条件，梯度下降可能最终在不同的局部最优
假	将学习率设置得非常小是无害的，并且只能加速梯度下降的收敛。	如果学习速率很小，则梯度下降最终会在每次迭代中占用极小的步数，因此这实际上会减慢（而不是加速）算法的收敛。