原文:http://cs229.stanford.edu/notes/cs229-notes1.pdf
我们要选择,以便最小化。要做到这一点,让我们使用一个搜索算法,它以的初始值开头,反复变化使越来越小,直到我们收敛到一个值,使得最小化。具体来说,让我们考虑梯度下降算法,由一些初始化的开始,然后反复执行更新:
(对的所有值同时执行此更新)在这里,被称为学习
原文:http://cs229.stanford.edu/notes/cs229-notes1.pdf
我们要选择,以便最小化。要做到这一点,让我们使用一个搜索算法,它以的初始值开头,反复变化使越来越小,直到我们收敛到一个值,使得最小化。具体来说,让我们考虑梯度下降算法,由一些初始化的开始,然后反复执行更新:
(对的所有值同时执行此更新)在这里,被称为学习