卷积神经网络03（梯度下降）

最新推荐文章于 2024-03-18 10:11:06 发布

贪玩老学长

最新推荐文章于 2024-03-18 10:11:06 发布

阅读量2.9k

点赞数 1

分类专栏：机器学习深度学习 python

本文链接：https://blog.csdn.net/weixin_42989738/article/details/108341100

版权

python 同时被 3 个专栏收录

91 篇文章 0 订阅

订阅专栏

机器学习

43 篇文章 3 订阅

订阅专栏

深度学习

18 篇文章 1 订阅

订阅专栏

回顾：
线性回归回顾
上面的是一个w（权重），可以直接进行搜索，比较简单，但是如果是多个变量，在使用这种方法查找就很费时，并且有时候还计算不出来。
还有一个问题就是，如果是很多权重，就会是多维的，并且还会有局部最小值的问题。

因此就有本节的梯度下降法出现

![在这里插入图片描述](https://img-blog.csdnimg.cn/20200901143933465.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mjk4OTczOA==,size_16,color_FFFFFF,t_70#pic_center

虽然不能得到最优解，但是可以得到局部最小值
在这里插入图片描述
可能会出现局部最小值的情况（非凸函数）局部最优
因此，梯度下降只能找到局部最优，并不一定是局部最小值（全局最优点）。
有一种特殊情况，叫做鞍点

由于g在某一段是0，那么就没有办法进行迭代了。
在这里插入图片描述
随机梯度下降法

代码复现，其中有一步是为了接收训练后的参数
#定义两个空列表，用于接收计算的epoch和cost(也就是所谓的损失)用于绘制可视化图像
epoch1 = []
cost1 = []
print(‘Predict (after training’,4,forward(4))
plt.plot(epoch1, cost1, c=‘g’)
plt.show()

import numpy as np
import matplotlib.pyplot as plt

# 准备数据
x_data = [1.0,2.0,3.0]
y_data = [2.0,4.0,6.0]

# 设置一个初始的权重
w = 1.0

# 定一个前向传播
def forward(x):
    return x*w

# MSE的目标函数
def cost(xs,ys):
    cost = 0
    for x,y in zip(xs,ys):
        y_pred = forward(x)
        cost += (y_pred - y)**2
        # print("cost",cost)
    return cost / len(xs)


# 梯度下降
def gradient(xs,ys):
    grad = 0
    for x,y in zip(xs,ys):
        grad += 2*x*(x*w - y)
    return grad / len(xs)

# 定义两个空列表，用于接收计算的epoch和cost(也就是所谓的损失)用于绘制可视化图像
epoch1 = []
cost1 = []

print('Predict (before training',4,forward(4))
for epoch in range(200):
    cost_val = cost(x_data,y_data)
    grad_val = gradient(x_data,y_data)
    w -= 0.01 * grad_val
    epoch1.append(epoch)
    cost1.append(cost_val)
    print("Epoch:",epoch,'w=',w,"loss=",cost_val)
    
print('Predict (after training',4,forward(4))
plt.plot(epoch1, cost1, c='g')
plt.show()

使用随机梯度下降法，可以克服鞍点的问题，即使陷入到鞍点，由于随机噪声的存在，就有可能跨越这个鞍点。
在这里插入图片描述
性能和时间复杂度取一个折中
使用batch进行，每次使用一组进行。
小批量的

贪玩老学长

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
卷积神经网络03（梯度下降）

回顾：线性回归回顾上面的是一个w（权重），可以直接进行搜索，比较简单，但是如果是多个变量，在使用这种方法查找就很费时，并且有时候还计算不出来。还有一个问题就是，如果是很多权重，就会是多维的，并且还会有局部最小值的问题。因此就有本节的梯度下降法出现虽然不能得到最优解，但是可以得到局部最小值可能会出现局部最小值的情况（非凸函数）局部最优因此，梯度下降只能找到局部最优，并不一定是局部最小值（全局最优点）。有一种特殊情况，叫做鞍点由于g在某一段是0，那么就没有办法进行迭代了。随机梯度下
复制链接

扫一扫