基展开

基展开

整理 PPT : Basis Expansions (by Yael Travis-Lumer)
参考 博客

介绍

线性模型 f(x)=β0+β1X1+...+βpXp 存在以下问题:在大多数情况下真实的模型不是线性的而且也不是可加的。于是我们可以使用非线性函数 hm(X) 来代替变量 X ,于是模型可以定义为:

f(X)=m=1Mβmhm(X)

这种形式称为在 X 上的线性基展开, hm(X) 可以称为基函数。这个模型在 hm(X) 是线性的,因此 β 可以通过最小二乘法来求解。

hm(X) 有以下常见的形式:
* XRp,hm(X)=Xm,m=1,...,p 这种情况下, hm(X) 不对 X 产生变换
* XR,hm(X)=Xm, 这种情况下,可以将 X 变换高阶。

基函数也可以是针对 X 的每个特征:

f(X)=p=1Pfp(Xp)=p=1Pm=1Mβpmhpm(Xp)

可以使用以下方法来约束模型的复杂度:
* Restriction Method
* Selection Method
* Regularization Method

不同类型的基展开

分段多项式和样条函数

样条函数(splines function):一类分段光滑,并且在交接点处也有光滑性的函数。
分段多项式(Piecewise Polynomials):
* 假设 XR
* 将 X 的值域分成相连的区块
* 在每个区块中使用一个多项式来拟合f(X)

我们把这样的函数称为分段多项式函数

例一
这里写图片描述

分成三个区域,以 ξ1 ξ2 为边界,也称为(knots)。

h1(X)h2(X)h3(X)=I(X<ξ1)=I(ξ1<X<ξ2)=I(X>ξ2)

这个模型就可以写为:
f(X)=m=13βmhm(X)=β1, β2, β3, X<ξ1ξ1<X<ξ2X>ξ2

这个例子中,函数 f 是分段常函数,β 可以使用最小二乘法求解( βm=Ym¯¯¯¯ )。

例二

这里写图片描述

在例一的基础上,添加三个函数:

h4(X)h5(X)h6(X)=I(X<ξ1)X=I(ξ1<X<ξ2)X=I(X>ξ2)X

模型更新为,

f(X)=m=16βmhm(X)=β1+β4X, β2+β5X, β3+β6X, X<ξ1ξ1<X<ξ2X>ξ2

这个例子中,函数 f 称为分段线性数,β 可以使用最小二乘求解。

以上例子存在一个问题:在knots处不连续。

解决方法

连续性约束(Continuity Restrictions)

为了保证在结点处函数连续,在每个节点处增加约束条件 ξi , f(ξ)=f(ξ+) 。一种直接的解法是使用包含连续性的基函数。在例二中,我们可以定义这样一组基函数

h1(X)h2(X)h3(X)h4(X)=1=X=(Xξ1)+=(Xξ2)+,where(Xξi)+={0Xξi

因此, f(X)=4i=1βmhm(X) 是连续的分段线性函数。

光滑(Smothness)

通常,例子中的拟合不够光滑,我们可以展开到更加高阶去拟合。
这里写图片描述

样条函数是使用多项式函数分段定义,并且在结点处光滑的函数,如果这个样条函数的在结点处连续且一阶和二阶导数都连续,就称为cubic spline。

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值