梯度下降（BGD、SGD、MSGD）差异

最新推荐文章于 2024-06-05 23:13:11 发布

程序员数学家

最新推荐文章于 2024-06-05 23:13:11 发布

阅读量2.6k

点赞数 5

分类专栏：机器学习数学

本文链接：https://blog.csdn.net/qq_26347025/article/details/79222967

版权

数学同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

机器学习

2 篇文章 0 订阅

订阅专栏

首先引荐一片写的很详细的博文https://www.cnblogs.com/pinard/p/5970503.html

具体介绍不在累述，本文主要可视化三种梯度下降的差异

先附上手动推导过程：

再附上Python代码：

# encoding=utf-8
import numpy as np
import matplotlib.pyplot as plt
#创建训练数据集
#假设训练学习一个线性函数y = 2.33x
EXAMPLE_NUM = 100#训练总数
BATCH_SIZE = 10#mini_batch训练集大小
TRAIN_STEP = 100#训练次数
LEARNING_RATE = 0.0001#学习率
X_INPUT = np.arange(EXAMPLE_NUM) * 0.1#生成输入数据X
Y_OUTPUT_CORRECT = 2.33 * X_INPUT#生成训练正确输出数据

def train_func(X, K):
    result = K * X
    return result
#BGD
#参数初始化值
k_BGD = 0.0
#记录迭代数据用于作图
k_BGD_RECORD = []
for step in range(TRAIN_STEP):
    SUM_BGD = 0
    for index in range(len(X_INPUT)):
        SUM_BGD += (train_func(X_INPUT[index], k_BGD) - Y_OUTPUT_CORRECT[index]) * X_INPUT[index]
    k_BGD -= LEARNING_RATE * SUM_BGD
    k_BGD_RECORD.append(k_BGD)
#SGD
k_SGD = 0.0
k_SGD_RECORD = []
for step in range(TRAIN_STEP):
    index = np.random.randint(len(X_INPUT))
    SUM_SGD = (train_func(X_INPUT[index], k_SGD) - Y_OUTPUT_CORRECT[index]) * X_INPUT[index]
    k_SGD -= LEARNING_RATE * SUM_SGD
    k_SGD_RECORD.append(k_SGD)
#MBGD
k_MBGD = 0.0
k_MBGD_RECORD = []
for step in range(TRAIN_STEP):
    SUM_MBGD = 0
    index_start = np.random.randint(len(X_INPUT) - BATCH_SIZE)
    for index in np.arange(index_start, index_start+BATCH_SIZE):
        SUM_MBGD += (train_func(X_INPUT[index], k_MBGD) - Y_OUTPUT_CORRECT[index]) * X_INPUT[index]
    k_MBGD -= LEARNING_RATE * SUM_MBGD
    k_MBGD_RECORD.append(k_MBGD)
#作图
plt.plot(np.arange(TRAIN_STEP), np.array(k_BGD_RECORD), label='BGD')
plt.plot(np.arange(TRAIN_STEP), k_SGD_RECORD, label='SGD')
plt.plot(np.arange(TRAIN_STEP), k_MBGD_RECORD, label='MBGD')
plt.legend()
plt.ylabel('weight')
plt.xlabel('step')
plt.show()

再附上执行结果图：