【python机器学习】普通最小二乘法多元线性回归

最新推荐文章于 2024-05-07 19:00:07 发布

二进制人工智能

最新推荐文章于 2024-05-07 19:00:07 发布

阅读量1.8k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_44378835/article/details/116332566

版权

机器学习专栏收录该内容

40 篇文章 61 订阅

订阅专栏

普通最小二乘法线性回归

若数据集 $D$ 由 $n$ 个属性描述，则线性回归的假设函数为：
$h_{\boldsymbol{w}, b}(\boldsymbol{x})=\sum_{i=1}^{n} w_{i} x_{i}+b=\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}+b$
其中， $\boldsymbol{w}\in \mathbb{R}^n$ 与 $b\in \mathbb{R}$ 为模型参数。

为了方便，我们通常将 $b$ 纳入权向量 $\boldsymbol{w}$ ，作为 $w_0$ ，同时为输入向量 $\boldsymbol{x}$ 添加一个常数1，作为 $x_0$ .
$\begin{array}{c}\boldsymbol{w}=\left(b, w_{1}, w_{2}, \ldots w_{n}\right)^{\mathrm{T}} \\\boldsymbol{x}=\left(1, x_{1}, x_{2}, \ldots x_{n}\right)^{\mathrm{T}}\end{array}$

此时，假设函数为：
$h_{\boldsymbol{\boldsymbol{w}}}(\boldsymbol{x})=\sum_{i=0}^{n} w_{i} x_{i}=\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}$

其中， $\boldsymbol{w}\in \mathbb{R}^{n+1}$ ，通过训练确定模型参数 $\boldsymbol{w}$ 后，便可使用模型对新的输入实例进行预测。

使用均方误差（MSE）作为损失函数，假设训练集 $D$ 有 $m$ 个样本，均方误差损失函数定义为
$\begin{aligned}J(\boldsymbol{w}) &=\frac{1}{2 m} \sum_{i=1}^{m}\left(h_{\boldsymbol{w}}\left(\boldsymbol{x}_{i}\right)-y_{i}\right)^{2} \\&=\frac{1}{2 m} \sum_{i=1}^{m}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}-y_{i}\right)^{2}\end{aligned}$

损失函数 $J (w)$ 最小值点是其极值点，可先求 $J (w)$ 对 $w$ 的梯度并令其为0，再通过解方程求得。

计算 $J(\boldsymbol{w})$ 的梯度：
$\begin{aligned}\nabla J(\boldsymbol{w}) &=\frac{1}{2 m} \sum_{i=1}^{m} \frac{\partial}{\partial \boldsymbol{w}}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}-y_{i}\right)^{2} \\&=\frac{1}{2 m} \sum_{i=1}^{m} 2\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}-y_{i}\right) \frac{\partial}{\partial \boldsymbol{w}}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}-y_{i}\right) \\&=\frac{1}{m} \sum_{i=1}^{m}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}-y_{i}\right) \boldsymbol{x}_{i}\end{aligned}$

以上公式使用矩阵运算描述形式更为简洁，设：
$\boldsymbol{X}=\left[\begin{array}{ccccc}1, & x_{11}, & x_{12} & \ldots & x_{1 n} \\1, & x_{21} & x_{22} & \ldots & x_{2 n} \\\vdots & \vdots & \vdots & \ddots & \vdots \\1, & x_{m 1} & x_{m 2} & \ldots & x_{m n}\end{array}\right]=\left[\begin{array}{c}\boldsymbol{x}_{1}^{\mathrm{T}} \\\boldsymbol{x}_{2}^{\mathrm{T}} \\\vdots \\\boldsymbol{x}_{m}^{\mathrm{T}}\end{array}\right]$
$\boldsymbol{y}=\left[\begin{array}{c}y_{1} \\y_{2} \\\vdots \\y_{m}\end{array}\right]$

$\boldsymbol{w}=\left[\begin{array}{c}b \\w_{1} \\w_{2} \\\vdots \\w_{n}\end{array}\right]$

那么，梯度计算公式可写为：
$\nabla J(\boldsymbol{w})=\frac{1}{m} \sum_{i=1}^{m}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}-y_{i}\right) \boldsymbol{x}_{i}$
$=\left[\begin{array}{c}\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_m\end{array}\right]\left[\begin{array}{c}\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{1}-y_{1} \\\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{2}-y_{2} \\\vdots \\\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{m}-y_{m}\end{array}\right]$
$=\left[\begin{array}{c}\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_m\end{array}\right]\left(\left[\begin{array}{c}\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{1} \\\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{2} \\\vdots \\\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{m}\end{array}\right]-\left[\begin{array}{c}y_{1} \\y_{2} \\\vdots \\y_m\end{array}\right]\right)$
$=\frac{1}{m} \boldsymbol{X}^{\mathrm{T}}(\boldsymbol{X} \boldsymbol{w}-\boldsymbol{y})$
令梯度为0，解得：
$\boldsymbol{\hat{w}}=\left(\boldsymbol{X}^{\mathrm{T}} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\mathrm{T}} \boldsymbol{y}$

$\boldsymbol{\hat{w}}$ 即为使得损失函数（均方误差）最小的 $\boldsymbol{w}$ 。以上求解最优 $\boldsymbol{w}$ 的方法被称为普通最小二乘法（Ordinary Least Squares，OLS）。

import numpy as np


class OLSLinearRession:
    def _ols(self, X, y):
        '''普通最小二乘法估算w'''
        tmp = np.linalg.inv(np.matmul(X.T, X))
        tmp = np.matmul(tmp, X.T)
        w = np.matmul(tmp, y)
        return w


    def _preprocess_data(self, X):
        '''数据预处理:添加x0=1'''
        m, n = X.shape
        X_ = np.ones((m, n + 1))
        X_[:, 1:] = X
        return X_

    def train(self, X, y):
        '''训练模型'''
        X = self._preprocess_data(X)
        self.w = self._ols(X, y)

    def predict(self, X):
        '''预测'''
        X = self._preprocess_data(X)
        y = np.matmul(X, self.w)
        return y

二进制人工智能

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
【python机器学习】普通最小二乘法多元线性回归

普通最小二乘线性回归一般情况下，线性回归模型假设函数为：hw,b(x)=∑i=1nwixi+b=wTx+bh_{w, b}(x)=\sum_{i=1}^{n} w_{i} x_{i}+b=w^{\mathrm{T}} x+bhw,b(x)=i=1∑nwixi+b=wTx+b其中，w∈Rnw\in \mathbb{R}^nw∈Rn与b∈Rb\in \mathbb{R}b∈R为模型参数。为了方便，通常将bbb纳入权向量www，作为w0w_0w0，同时为输入向量xxx添加一个常数1，作为x0
复制链接

扫一扫