机器学习--线性回归

heikee_g

已于 2024-05-13 09:21:53 修改

阅读量2k

点赞数 44

文章标签：机器学习人工智能线性回归深度学习回归

于 2024-05-13 09:20:36 首次发布

本文链接：https://blog.csdn.net/heikegrr/article/details/138784435

版权

文章目录

基函数
基函数的选择
正则化最小平方

基函数

在一些应用中，我们对原始数据变量进行一些预处理或特征提取。

比如原始变量为x，特征可以表示为基函数的形式{φ(x)}。

通过采用基函数，我们使得线性模型可以是输入变量的非线性函数。

将输⼊变量的固定的非线性函数进⾏线性组合

$y(x,w)=w_0+\sum_{j=1}^{M-1}w_j\phi_j(x)$

$\phi_j(x)$ 被称为基函数

模型中的参数总数为M

$y(\boldsymbol{x},\boldsymbol{w})=\sum_{j=0}^{M-1}w_j\phi_j(\boldsymbol{x})=\boldsymbol{w}^T\phi(\boldsymbol{x})$

$\boldsymbol{w}=(w_0,\ldots,w_{M-1})^T$ $\phi=(\phi_0,\ldots,\phi_{M-1})^T$

基函数的选择

多项式基函数

多项式曲线拟合：

$y(x,\boldsymbol{w})=w_0+w_1x+w_2x^2+\ldots+w_Mx^M=\sum_{j=0}^Mw_jx^j$

其中M是多项式的阶数（order)， $x^j$ 是 $x$ 的 $j$ 次幂

多项式系数 $w_{0},...,w_{M}$ 整体记作向量 $w$

多项式函数 $y (x, w)$ 是 $x$ 的一个非线性函数

是系数 $w$ 的一个线性函数
“高斯”基函数

“高斯”基函数：

$\phi_j(x)=\exp\left\{-\frac{(x-\mu_j)^2}{2s^2}\right\}$

参数 $\mu_j$ 控制了基函数在输入空间中的位置，参数 $s$ 控制了基函数的空间大小
sigmoid基函数

sigmoid:

$\phi_j(x)=\boldsymbol{\sigma}\Bigg(\frac{x-\mu_j}{s}\Bigg)\quad\text\\\\{where}\quad\sigma(a)=\frac{1}{1+\exp(-a)}$

$\phi_j(x)=x^j$

正则化最小平方

为误差函数添加正则化项的思想来控制过拟合

$E_D(\boldsymbol{w})+\lambda E_W(\boldsymbol{w})$

λ是正则化系数，控制数据相关的误差 $E_D(w)*$ 和正则化项 $E_W(w)*$ 的相对重要性

平方和误差函数：

$E_D(\boldsymbol{w})=\frac{1}{2}\sum_{n=1}^N\{t_n-\boldsymbol{w}^T\boldsymbol{\phi}(\boldsymbol{x}_n)\}^2$

最简单正则化项——权值衰减：

$E_W(\boldsymbol{w})=\frac12\boldsymbol{w}^T\boldsymbol{w}$

总误差函数

$\boldsymbol{w}^T\phi(\boldsymbol{x}_n)\}^2+\frac\lambda2\boldsymbol{w}^T\boldsymbol{w}$

                                             岭回归、山脊回归（Ridge Regression）

权值衰减法：把参数的值向零的方向收缩

岭回归的闭式解

$\frac12\sum_{n=1}^N\{t_n-\boldsymbol{w}^T\phi(\boldsymbol{x}_n)\}^2+\frac\lambda2\boldsymbol{w}^T\boldsymbol{w}$

关于w的梯度等于零，解出w

. 正则化解 $w=(\lambda\boldsymbol{I}+\boldsymbol{\Phi}^T\boldsymbol{\Phi})^{-1}\boldsymbol{\Phi}^T\mathbf{t}$

原来求逆的矩阵 $\Phi^{\mathrm{T}}\Phi$ 可能是奇异阵的，现在 $\lambda\mathbf{I}+\Phi^{\mathrm{T}}\Phi$ 是满秩矩阵，即使 $\Phi^{\mathrm{T}}\Phi$ 不是.

在这里插入图片描述

一般式正则化项

$\frac12\sum_{n=1}^N\{t_n-\boldsymbol{w}^T\boldsymbol{\Phi}(\boldsymbol{x}_n)\}^2+\frac\lambda2\sum_{j=1}^M|w_j|^q$

在这里插入图片描述

q = 2对应于二次正则化项，被称为岭回归、山脊回归（Ridge Regression）

q = 1对应于一次正则化项，被称为套索**（Lasso）回归**

Lasso回归当 λ 足够大时，一些系数会趋近于0，对应的基函数项不发挥作用，从而得到一个稀疏的模型。****

最小化 $\frac12\sum_{n=1}^N\{t_n-\boldsymbol{w}^T\boldsymbol{\Phi}(\boldsymbol{x}_n)\}^2+\frac\lambda2\sum_{j=1}^M|w_j|^q$

在这里插入图片描述

正则化方法

通过限制模型的复杂度，使得复杂的模型能够在有限⼤⼩的数据集上进⾏训练，⽽不会产⽣严重的过拟合。

确定最优的模型复杂度的问题：

从确定合适的基函数数量的问题转移到了确定正则化系数λ的合适值的问题。

heikee_g

关注

44
点赞
踩
37

收藏

觉得还不错? 一键收藏
0
评论
机器学习--线性回归

足够大时，一些系数会趋近于0，对应的基函数项不发挥作用，从而得到一个稀疏的模型。通过限制模型的复杂度，使得复杂的模型能够在有限⼤⼩的数据集上进⾏训练，⽽。从确定合适的基函数数量的问题转移到了确定正则化系数λ的合适值的问题。= 1对应于一次正则化项，被称为套索**（Lasso）回归**通过采用基函数，我们使得线性模型可以是输入变量的非线性函数。比如原始变量为x，特征可以表示为基函数的形式{φ(x)}。. 正则化解。控制了基函数在输入空间中的位置，参数。控制了基函数的空间大小。
复制链接

扫一扫

机器学习--线性回归

文章目录

基函数

基函数的选择

正则化最小平方

最简单正则化项——权值衰减：

岭回归的闭式解

一般式正则化项

正则化方法

“相关推荐”对你有帮助么？