机器学习：批量梯度下降法（线性回归中的使用）

最新推荐文章于 2023-01-14 19:42:16 发布

ab1213456

最新推荐文章于 2023-01-14 19:42:16 发布

阅读量984

点赞数

文章标签：数据结构与算法 python 人工智能

原文链接：http://www.cnblogs.com/volcao/p/9116868.html

版权

本文介绍了批量梯度下降法在机器学习中的应用，特别是在线性回归中的推导、实现和优化。从目标函数的推导、算法实现到数据标准化，探讨了梯度下降法的优势，包括与正规化方程比较，以及如何处理数据大小差异的问题。

摘要由CSDN通过智能技术生成

▽J(θ) 中，θ 是未知数，X 是样本中的已知数；
公式变形思路：▽J(θ) 中的每一项都是 m 项的求和，因此梯度的大小跟样本数量有关，样本数量越大，梯度中的每一个元素值也就越大，因此所求得的梯度中的每一个元素的值，受到了 m 的影响，而在优化的过程中，梯度中的每一个元素的值最好和 m 无关；

当使用梯度下降法求解目标函数的最小值时，需要特殊设计目标函数，不见得所有的目标函数都非常合适此方法，虽然理论上即使梯度中的元素值很大，依然可以通过调整 η 得到想要的结果，但是这样可能会影响效率；

模拟简单线性回归

import numpy as np

np.random.seed(666)
x = 2 * np.random.random(size=100)
y = x * 3. + 4. + np.random.normal(size=100)

X = x.reshape(-1, 1)

# np.random.normal(size=100)：噪音，用均值为0，方差为1的随机正态分布生成

计算损失函数值（损失函数：J(θ) = MSE(y, ý)）

# x_b：变形后的X_train中的Xb，增加了第一列全为1之后的矩阵
# y：y_train
def J(theta, x_b, y):
    try:
        return np.sum((y

关注