梯度下降法求解线性回归之python实现

最新推荐文章于 2024-02-22 15:18:11 发布

just_do_it_123

最新推荐文章于 2024-02-22 15:18:11 发布

阅读量1.3w

点赞数

分类专栏： python 文章标签： python 线性回归梯度下降法

本文链接：https://blog.csdn.net/just_do_it_123/article/details/51056260

版权

python 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

线性回归其实就是寻找一条直线拟合数据点，使得损失函数最小。直线的表达式为：

y i = ω 1 x i, 1 + ω 2 x i, 2 + ω j x i, j + . . . + b

$y_i = \omega_1x_{i,1}+\omega_2x_{i,2}+\omega_jx_{i,j}+...+b$
损失函数的表达式为：

J = 1 2 \sum i = 0 m (y i - y p r e d i c t_i) 2

$J = \frac{1}{2}\sum_{i=0}^m{(y_i-y_{predict\_i})^2}$
其中m为数据点总数。
现在我们使用梯度下降法求解函数

J $J$ 的最小值，梯度下降法原理示意图如下：

这里写图片描述
如上图所示，只要自变量 $x$ 沿着负梯度的方向变化，就可以到达函数的最小值了，反之，如果沿着正梯度方向变化，就可以到达函数的最大值。
我们要求解 $J$ 函数的最小值，那么就要求出每个 $\omega$ 的梯度和 $b$ 的梯度，由于梯度太大，可能会导致自变量沿着负梯度方向变化时， $J$ 的值出现震荡，而不是一直变小，所以在梯度的前面乘上一个很小的系数 $\alpha$ 。
由以上可以总结出 $\omega$ 和 $b$ 的更新公式：

ω j = ω j - α \nabla J (ω j)

$\omega_j = \omega_j-\alpha\nabla{J}(\omega_j)$

b = b - α \nabla J (b)

$b = b-\alpha\nabla{J}(b)$
梯度公式（其实就是求导而已）：

\nabla J (ω j) = \partial J \partial ω j = \sum i = 0 m (y i - y p r e d i c t_i) (- x i, j) = \sum i = 0 m (y p r e d i c t_i - y i) x i, j

$\begin{align} \nabla{J}(\omega_j) & = \frac{\partial{J}}{\partial{\omega_j}} \\ & = \sum_{i=0}^m{(y_i-y_{predict\_i})(-x_{i,j})}\\ & = \sum_{i=0}^m{(y_{predict\_i}-y_i)x_{i,j}}\\ \end{align}$

\nabla J (b) = \partial J \partial b = \sum i = 0 m (y p r e d i c t_i - y i)

$\begin{align} \nabla{J}(b) & = \frac{\partial{J}}{\partial{b}} \\ & = \sum_{i=0}^m{(y_{predict\_i}-y_i)}\\ \end{align}$
系数

α $\alpha$ 如果随着迭代的进行越来越小的话，有利于防止迭代后期震荡的发生，是算法收敛，

α $\alpha$ 的更新公式：

α = 1 i + 1 + 0.001

$\alpha = \frac{1}{i+1}+0.001$
其中i是迭代次数，起始为0
下面为使用python具体实现梯度下降法求解线性回归
原始数据：

x = np.arange(-2,2,0.1)
y = 2*x+np.random.random(len(x))
x = x.reshape((len(x),1))
y = y.reshape((len(x),1))

这里写图片描述

开始迭代：

for i in range(maxgen):
    alpha = 1/float(i+1)+alpha0
    e = np.dot(x,seta.reshape((len(seta),1)))+b-y # 二维列向量
    mse = np.linalg.norm(e)
    delta_seta = np.dot(e.T,x)[0]
    delta_seta_norm = np.linalg.norm(delta_seta)
    b = b-alpha*np.sum(e)
    seta = seta-alpha*delta_seta
    print u'迭代次数：',i
    print u'梯度：',delta_seta_norm,'seta',seta,'b:',b,'mse',mse
    print 'alpha:',alpha,'sum(e):',sum(e)

算法运行结果：
这里写图片描述

这里写图片描述
如上图所示，最后梯度的值逐渐降为0，说明达到的 J <script type="math/tex" id="MathJax-Element-20">J</script>的极值点。

just_do_it_123

关注

0
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
梯度下降法求解线性回归之python实现

线性回归其实就是寻找一条直线拟合数据点，使得损失函数最小。直线的表达式为： yi=ω1xi,1+ω2xi,2+ωjxi,j+...+by_i = \omega_1x_{i,1}+\omega_2x_{i,2}+\omega_jx_{i,j}+...+b 损失函数的表达式为： J=12∑i=0m(yi−ypredict_i)2J = \frac{1}{2}\sum_{i=0}^m{(y_i-y
复制链接

扫一扫