随机梯度下降优化算法、基于冲量的优化算法、TensorFlow中的优化算法API

最新推荐文章于 2024-05-27 20:03:59 发布

地球是我捏圆的丶

最新推荐文章于 2024-05-27 20:03:59 发布

阅读量1.5k

点赞数 3

分类专栏： python学习

本文链接：https://blog.csdn.net/qq_43494997/article/details/96897289

版权

本文详细介绍了随机梯度下降（SGD）及其变体，如基于冲量的梯度下降优化算法，并在TensorFlow中探讨了常用的优化算法API，包括Adagrad、RMSprop和Adam等。通过MNIST数据集的图像识别示例展示了SGD的实际应用，讨论了不同优化算法的选择策略。

摘要由CSDN通过智能技术生成

1：随机梯度下降优化算法

一：普通的梯度下降算法在更新回归系数时要遍历整个数据集，是一种批处理方法，这样训练数据特别忙庞大时，可能出现如下问题：

收敛过程可能非常慢；
如果误差曲面上有多个局极小值，那么不能保证这个过程会找到全局最小值。

随机梯度下降法随机抽取一个样本来计算误差，然后更新权值
二：随机梯度下降
为了解决上面的问题，实际中我们应用的是梯度下降的一种变体被称为随机梯度下降。
上面公式中的误差是针对于所有训练样本而得到的，而随机梯度下降的思想是根据每个单独的训练样本来更新权值，这样我们上面的梯度公式就变成了：
在这里插入图片描述
经过推导后，我们就可以得到最终的权值更新的公式：

有了上面权重的更新公式后，我们就可以通过输入大量的实例样本，来根据我们预期的结果不断地调整权值，从而最终得到一组权值使得我们的算法能够对一个新的样本输入得到正确的或无限接近的结果。

举例：图像数字识别

①：MNIST数据集:
官方下载地址：http://yann.lecun.com/exdb/mnist/
②：tensorflow
自行用pip进行安装（window适用于python3.6及以上的版本）
③：直接在Pycharm里面建立一个MNIST_data文件夹，将压缩文件导入进去

# -*- coding:utf-8 -*-
#@Time  : 2019/7/22 15:20
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

batch_size = 100

n_batch = mnist.train.num_examples // batch_size

x = tf.placeholder(tf.float32, [None, 784])
y = tf.placeholder(tf.float32, [None, 10])

W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(x, W)+b)

loss = tf.reduce_mean(tf.square(y-prediction))

train_step = tf.train.GradientDescentOptimizer(0.2).minimize(loss)
init = tf.global_variables_initializer()

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(prediction, 1))

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs,batch_ys = mnist.train.next_batch(batch_size)
            sess.run(train_step, feed_dict={x:batch_xs, y:batch_ys})
        acc = sess.run(accuracy, feed_dict={x:mnist.test.images, y:mnist.test.labels})
        print("Iter"+str(epoch)+",Testinng Accuracy"+str(acc))

运行结果：
Iter0,Testinng Accuracy0.8327
Iter1,Testinng Accuracy0.87
Iter2,Testinng Accuracy0.881
Iter3,Testinng Accuracy0.8884
Iter4,Testinng Accuracy0.894
Iter5,Testinng Accuracy0.8971
Iter6,Testi

最低0.47元/天解锁文章

地球是我捏圆的丶

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
随机梯度下降优化算法、基于冲量的优化算法、TensorFlow中的优化算法API

1：随机梯度下降优化算法一：普通的梯度下降算法在更新回归系数时要遍历整个数据集，是一种批处理方法，这样训练数据特别忙庞大时，可能出现如下问题：收敛过程可能非常慢；如果误差曲面上有多个局极小值，那么不能保证这个过程会找到全局最小值。随机梯度下降法随机抽取一个样本来计算误差，然后更新权值二：随机梯度下降为了解决上面的问题，实际中我们应用的是梯度下降的一种变体被称为随机梯度下降。上面...
复制链接

扫一扫