学习笔记《统计学习基础》第五章 基展开与正则化

5.1 引言

线性模型 { 线 性 回 归 线 性 判 别 分 析 逻 辑 斯 蒂 回 归 分 离 超 平 面 \begin{cases} 线性回归\\线性判别分析\\逻辑斯蒂回归\\分离超平面 \end{cases} 线线
真实函数 f ( X ) f(X) f(X) X X X的线性函数的情况非常罕见。

①对于回归问题
通常 f ( X ) = E ( Y ∣ X ) f(X)=E(Y|X) f(X)=E(YX) X X X上是非线性和非可加的,而用一个线性模型表示会很方便,因为线性模型容易解释,并且是 f ( X ) f(X) f(X)一阶泰勒近似
N N N很小或 p p p很大时,线性模型可能是不会过分拟合的唯一模型。
②对于分类问题
线性的贝叶斯最佳判定边界蕴含 P r ( Y = 1 ∣ X ) Pr(Y=1|X) Pr(Y=1X)的某个单调变换在 X X X上是线性的。

本章的核心思想是用附加的变量( X X X的变换)增广或替换输入向量 X X X,然后在新的导出的输入特征空间上使用线性模型。

h m ( X ) : R p ↦ R h_m(X):\mathbb{R}^p\mapsto\mathbb{R} hm(X):RpR X X X的第 m m m个变换
m = 1 , 2 , . . . , M m=1,2,...,M m=1,2,...,M。然后,建立 X X X的线性基展开模型:
f ( X ) = ∑ m = 1 M β m h m ( X ) f(X)=\sum_{m=1}^M\beta_mh_m(X) f(X)=m=1Mβmhm(X)

优点是:一旦确定了基函数 h m h_m hm, 则模型在这些新变量上是线性的,并且拟合过程和以前一样。

一些简单但广泛使用的 h m h_m hm的例子:
∙ h m ( X ) = X m , m = 1 , 2 , . . . p \bullet h_m(X)=X_m,m=1,2,...p hm(X)=Xm,m=1,2,...p
∙ h m ( X ) = X j 2 o r X j X k \bullet h_m(X)=X_j^2 orX_jX_k hm(X)=Xj2orXjXk, 得到高阶泰勒展开式
∙ h m ( X ) = l o g ( X j ) , X j , ∣ ∣ X ∣ ∣ , . . . \bullet h_m(X)=log(X_j),\sqrt{X_j},||X||,... hm(X)=log(Xj),Xj ,X,...
∙ h m ( X ) = I ( L m ≤ X k < U m ) , X k \bullet h_m(X)=I(L_m\le X_k< U_m),X_k hm(X)=I(LmXk<Um),Xk 的区间指示子

限制模型复杂度的三种常用方法:
∙ \bullet 限制法
∙ \bullet 选择法
∙ \bullet 正则化法

5.2 分段多项式和样条

①分段常数
h 1 ( X ) = I ( X < ξ 1 ) h_1(X)=I(X<\xi_1) h1(X)=I(X<ξ1)
h 2 ( X ) = I ( ξ 1 ≤ X < ξ 2 ) h_2(X)=I(\xi_1\le X<\xi_2) h2(X)=I(ξ1X<ξ2)
h 3 ( X ) = I ( X ≥ ξ 2 ) h_3(X)=I(X\ge\xi_2) h3(X)=I(Xξ2)
m o d e l : f ( X ) = ∑ m = 1 3 β m h m ( X ) model:f(X)=\sum_{m=1}^3\beta_mh_m(X) model:f(X)=m=13βmhm(X)
要通过 Y Y Y来估计 β 1 , β 2 , β 3 \beta_1,\beta_2,\beta_3 β1,β2,β3
用最小二乘法,可得 β ^ m = Y ˉ m \hat{\beta}_m=\bar{Y}_m β^m=Yˉm, 表示 Y Y Y在第 m m m个区间上的均值

②分段线性拟合
h m + 3 ( X ) = h m ( X ) X , m = 1 , 2 , 3 h_{m+3}(X)=h_m(X)X,m=1,2,3 hm+3(X)=hm(X)X,m=1,2,3
f ( ξ 1 − ) = f ( ξ 1 + ) f(\xi_1^-)=f(\xi_1^+) f(ξ1)=f(ξ1+)
β 1 + β 4 ξ 1 = β 2 + β 5 ξ 1 \beta_1+\beta_4\xi_1=\beta_2+\beta_5\xi_1 β1+β4ξ1=β2+β5ξ1

③结合约束的基函数
没看懂

通常,我们偏爱光滑一些的函数(至少肉眼看上去纽结处是光滑的),这可以通过提高局部多项式的次数来实现。

三次样条 ( c u b i c (cubic (cubic s p l i n e ) spline) spline),在纽结上具有连续的一、二阶导数

快速检查证实参数计数(没看懂)

纽结固定的样条又称为回归样条( r e g r e s s i o n regression regression s p l i n e spline spline),需要选定样条的次数、纽结数和它们的布局。
一种简单的方法是:没看懂

5.2.1 自然三次样条

5.2.2 例:南非心脏病(续)

5.2.3 例:音素识别

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值