学习笔记《统计学习基础》第五章基展开与正则化

最新推荐文章于 2023-09-08 18:14:14 发布

LittleFish0820

最新推荐文章于 2023-09-08 18:14:14 发布

阅读量493

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46459047/article/details/110920179

版权

目录

5.1 引言
5.2 分段多项式和样条

5.1 引言

线性模型 $\begin{cases} 线性回归\\线性判别分析\\逻辑斯蒂回归\\分离超平面 \end{cases}$
真实函数 $f (X)$ 是 $X$ 的线性函数的情况非常罕见。

①对于回归问题
通常 $f (X) = E (Y ∣ X)$ 在 $X$ 上是非线性和非可加的，而用一个线性模型表示会很方便，因为线性模型容易解释，并且是 $f (X)$ 的一阶泰勒近似。
当 $N$ 很小或 $p$ 很大时，线性模型可能是不会过分拟合的唯一模型。
②对于分类问题
线性的贝叶斯最佳判定边界蕴含 $P r (Y = 1 ∣ X)$ 的某个单调变换在 $X$ 上是线性的。

本章的核心思想是用附加的变量（ $X$ 的变换）增广或替换输入向量 $X$ ，然后在新的导出的输入特征空间上使用线性模型。

记 $h_m(X):\mathbb{R}^p\mapsto\mathbb{R}$ 为 $X$ 的第 $m$ 个变换
$m = 1, 2, . . ., M$ 。然后，建立 $X$ 的线性基展开模型:
$f(X)=\sum_{m=1}^M\beta_mh_m(X)$

优点是：一旦确定了基函数 $h_m$ , 则模型在这些新变量上是线性的，并且拟合过程和以前一样。

一些简单但广泛使用的 $h_m$ 的例子：
$\bullet h_m(X)=X_m,m=1,2,...p$
$\bullet h_m(X)=X_j^2 orX_jX_k$ , 得到高阶泰勒展开式
$\bullet h_m(X)=log(X_j),\sqrt{X_j},||X||,...$
$\bullet h_m(X)=I(L_m\le X_k< U_m),X_k$ 的区间指示子

限制模型复杂度的三种常用方法：
$\bullet$ 限制法
$\bullet$ 选择法
$\bullet$ 正则化法

5.2 分段多项式和样条

①分段常数
$h_1(X)=I(X<\xi_1)$
$h_2(X)=I(\xi_1\le X<\xi_2)$
$h_3(X)=I(X\ge\xi_2)$
$model:f(X)=\sum_{m=1}^3\beta_mh_m(X)$
要通过 $Y$ 来估计 $\beta_1,\beta_2,\beta_3$
用最小二乘法，可得 $\hat{\beta}_m=\bar{Y}_m$ , 表示 $Y$ 在第 $m$ 个区间上的均值

②分段线性拟合
$h_{m+3}(X)=h_m(X)X,m=1,2,3$
$f(\xi_1^-)=f(\xi_1^+)$
$\beta_1+\beta_4\xi_1=\beta_2+\beta_5\xi_1$

③结合约束的基函数
没看懂

通常，我们偏爱光滑一些的函数（至少肉眼看上去纽结处是光滑的），这可以通过提高局部多项式的次数来实现。

三次样条 $(c u b i c$ $s p l i n e)$ ，在纽结上具有连续的一、二阶导数

快速检查证实参数计数（没看懂）

纽结固定的样条又称为回归样条( $r e g r e s s i o n$ $s p l i n e$ )，需要选定样条的次数、纽结数和它们的布局。
一种简单的方法是：没看懂

5.2.1 自然三次样条

5.2.2 例：南非心脏病(续)

5.2.3 例：音素识别

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
学习笔记《统计学习基础》第五章基展开与正则化

目录5.1 引言5.2 分段多项式和样条5.2.1 自然三次样条5.2.2 例：南非心脏病(续)5.2.3 例：音素识别5.1 引言线性模型 {线性回归线性判别分析逻辑斯蒂回归分离超平面\begin{cases} 线性回归\\线性判别分析\\逻辑斯蒂回归\\分离超平面 \end{cases}⎩⎪⎪⎪⎨⎪⎪⎪⎧线性回归线性判别分析逻辑斯蒂回归分离超平面真实函数f(X)f(X)f(X)是XXX的线性函数的情况非常罕见。①对于回归问题通常f(X)=E(Y∣X)f(X)=E(Y|X)f(X)=E(Y
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。