吴恩达机器学习之线性回归

最新推荐文章于 2023-04-01 13:42:45 发布

qq_31769869

最新推荐文章于 2023-04-01 13:42:45 发布

阅读量237

点赞数 2

分类专栏：机器学习文章标签：机器学习 python 线性规划

本文链接：https://blog.csdn.net/qq_31769869/article/details/105933342

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

几个变量的约定

X代表属性的矩阵， $x^{(i)}$ 代表X的第i行， $x^{(i)}_j$ 代表X第i行第j列， $\theta$ 是参数向量。

线性回归

估计函数 $h(x)=\sum_{i=0}^mx^{(i)}\theta=X\theta$
代价函数 $J(\theta) = \frac{1}{2m}\sum^m_{i=0}(x^{(i)}\theta - y^{(i)})^2=\frac{1}{2m}\sum_{i=0}^m(X\theta - y)^2$

上述代价函数其实就是是预估值与真实值得偏差，除2m而不是m得原因是为了之后好求导。（当然求解的方法中不是所有都要求导的）

线性回归的目标：求得合适的 $\theta$ ，使得J( $\theta$ )最小。得到的 $\theta$ 代回到h(x)中，就可以得到线性的模型。

求解方法

梯度下降法

根据偏导得定义，使用迭代的方法求解。首先给 $\theta$ 一个初值，然后根据以下公式进行迭代： $\theta^{(i)} = \theta^{(i)}-\alpha\frac{\delta J}{\delta\theta^{(i)}}$ 其中 $\frac{\delta J}{\delta\theta^{(i)}}$ 是 $\theta^{(i)}$ 方向的偏导， $\alpha$ 为学习效率，这个值得大小需要手动尝试。如果 $\alpha$ 太大。可能不收敛， $\alpha$ 太小那么收敛速度太慢。可以尝试0.001，0.01，0.1，0.3，1等值

为了好表示，上述的i记为j
式中 $\frac{\delta J}{\delta\theta^{(j)}} = \frac{1}{m}\sum_{i=0}^m(x^{(i)}\theta - y^{(i)})x^{(i)}_j$

上述的求导公式比较繁琐，可以用矩阵的方式表示： $\theta = \theta - \frac{\alpha}{m}(X\theta - y)X$

有了以上公式就可以很容易的使用python的numpy库进行运算了。可以设定迭代次数为终止条件，也可以设定前一次和这一次 $\theta$ 的变化量小于某个值（比如0.01）作为终止条件。

以下是一个简单的实现，求解的问题属性只有1个，除了默认的1.

import numpy as np
import matplotlib.pyplot as plt

#样本
x = np.array([1 , 3, 5, 7, 8, 10])
y = np.array([3, 6 , 9, 12, 15, 20])

#矩阵X
X = np.column_stack((np.array([1,1,1,1,1,1]),x))

#m为样本的数量
m = x.shape[0]

#学习效率
alpha = 0.01

#初始化theta
theta = [0, 0]

#更新theta
newTheta = theta - alpha / m * (X @ theta - y) @ X

#计数，判断迭代了多少次
cnt = 1

#迭代的总次数
total = 100

#代价函数的截断误差
precision = 0.01

#迭代
while np.any(newTheta - theta > precision) and cnt < total:
    theta = newTheta
    newTheta = theta - alpha / m * (X @ theta - y) @ X
    cnt = cnt + 1

#获得估计的Y值
predY = X @ newTheta

plt.scatter(x, y)
plt.plot(x, predY)
plt.show()

线性回归的结果如下：
在这里插入图片描述
2.使用正规方程
$\theta = (X^TX)^{-1}X^Ty$
这个方法实现起来简单，但是当规模太大的时候，复杂度太高。吴恩达对这个问题表示当特征值的个数大于万以上，就考虑其他方法了。

以下是这个方法的实现，直接使用梯度下降法的例子，我们可以直观的看到他们的回归的结果。为了代码的简练，只写了这个算法求解 $\theta$ 的代码。

theta1 = np.linalg.inv(X.T@X)@X.T@y
predY1 = X @ theta1

图像如下：
在这里插入图片描述
蓝色的直线是上述梯度下降法求解的归回直线，橙色的是正规方程求解的直线，我们可以看到，两条直线十分接近，几乎重叠了。

qq_31769869

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录