1. 梯度下降法介绍
梯度下降法简单来说就是一个迭代优化算法,目的是找到函数的局部最小值,该算法与最小二乘法相似,用于求解线性回归问题,但梯度下降的意义在于通过寻找梯度最大的方向下降(或上升),来找到损失函数最小时所对应的参数值。
梯度下降法有成熟的推导步骤与求解公式,并且有三种不同的实现类型:
参考资料:梯度下降法介绍及python实现
① 批量梯度下降(BGD):每次使用全量的训练集样本来更新模型参数,得到的是全局最优解,但样本数目很多时,训练过程会很慢。
② 随机梯度下降(SGD):每次从训练集中随机选择一个样本来进行迭代,快速并可进行在线更新,但可能得到的是局部最优。
③ Mini-batch梯度下降算法:在每次更新速度与更新次数中间取得一个平衡,每次更新从训练集中随机选择n个样本来进行学习。
接下来将分别使用numpy和PyTorch实现批量梯度下降。
2. numpy实现梯度下降法
原文链接:梯度下降法介绍及python实现
下面代码将分成三个部分,将三个部分拼在一起就是完整代码,不会有任何缺漏。
2.1 设定初始值
import numpy as np
from scipy import stats
import