Hypothesis
Cost Function
它描述的是在任一θ下,h(x)和相应的y的接近程度,我们的目的是让它尽可能地小。
To break it apart, it is 12x^ where x^ is the mean of the squares of hθ(x(i))−y(i) , or the difference between the predicted value and the actual value.
用等高线表示如下图所示
Gradient Descent
α >0是学习率,,更新时两个变量同时更新。