笔记 - 梯度下降：基于tensorflow的三种实现

最新推荐文章于 2020-05-14 13:17:26 发布

chen_holy

最新推荐文章于 2020-05-14 13:17:26 发布

阅读量343

点赞数

分类专栏： AI 编程梯度下降

本文链接：https://blog.csdn.net/chen_holy/article/details/91398130

版权

编程同时被 3 个专栏收录

73 篇文章 0 订阅

订阅专栏

57 篇文章 1 订阅

订阅专栏

梯度下降

2 篇文章 0 订阅

订阅专栏

以线性回归为例

原生实现

...
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name='theta')
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
rmse = tf.sqrt(tf.reduce_mean(tf.square(error), name="rmse"))
# 梯度的公式：(y_pred - y) * xj
gradients = 2/m * tf.matmul(tf.transpose(X), error)
# 赋值函数对于BGD来说就是 theta_new = theta - (learning_rate * gradients)
training_op = tf.assign(theta, theta - learning_rate * gradients)
...

2.自动求导

theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name='theta')
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
# 梯度的公式：(y_pred - y) * xj
# gradients = 2/m * tf.matmul(tf.transpose(X), error)
gradients = tf.gradients(mse, [theta])[0]
# 赋值函数对于BGD来说就是 theta_new = theta - (learning_rate * gradients)
training_op = tf.assign(theta, theta - learning_rate * gradients)

3.优化器

theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name='theta')
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
# 梯度的公式：(y_pred - y) * xj
training_op = tf.train.GradientDescentOptimizer(learning_rate=learning_rate).minimize(mse)

chen_holy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
笔记 - 梯度下降：基于tensorflow的三种实现

以线性回归为例原生实现...theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name='theta')y_pred = tf.matmul(X, theta, name="predictions")error = y_pred - yrmse = tf.sqrt(tf.reduce_mean(tf.sq...
复制链接

扫一扫

专栏目录