10.3 第二步:设计挑选函数的准则
前面,我们提及过, 损失的测量是挑选函数的准则。 这里,我们将求 MSE,
LOSS
=
MSE
=
1
N
∑
i
=
1
N
∣
(
y
(
i
)
−
y
^
(
i
)
)
2
∣
,
\text{LOSS}=\text{MSE}=\frac{1}{N}\sum_{i=1}^{N}\left |(y^{(i)}-\widehat{y}^{(i)})^2\right |,
LOSS=MSE=N1i=1∑N∣∣∣(y(i)−y
(i))2∣∣∣,
其中,
y
^
\widehat{y}
y
是估计值。
而且,我们希望通过训练的输入数据找到使得损失值最小的那一组系数
w
1
,
w
2
,
w
0
w_1, w_2, w_0
w1,w2,w0.
y_hat = tf.matmul(X, W)
loss_op = 1/(2 * len(input_features)) * tf.matmul((y_hat-y), (y_hat-y), transpose_a=True)
opt = tf.train.GradientDescentOptimizer(learning_rate=0.01)
train_op = opt.minimize(loss_op)
第 1 行是房价估算,
第 3 行是损失函数定义,
第 5 行是定义用梯度下降法,
第 7 行是说优化时,损失函数应该是越小越好。