R语言与函数估计学习笔记(样条方法)

本文介绍了样条估计在处理非线性度变化的函数时的优势,对比了多项式样条和光滑样条。详细讲解了B样条的定义,并通过R语言的`splines`包展示了B样条和光滑样条的实现。样条估计通过添加光滑性惩罚避免过拟合,文中以实际数据集为例展示了应用过程。
摘要由CSDN通过智能技术生成

样条估计

如果函数在不同地方有不同的非线性度,或者有多个极值点,那么用多项式特别是低阶多项式来完成拟合是非常不合适的。一种解决办法是我们之前提到的近邻多项式(或者称局部多项式),另一种就是样条——用分段的低阶多项式逼近函数。
关于样条,常用的有两类,一类是多项式样条,另一类是光滑样条。

多项式样条

多项式样条的样条基有很多,最为著名的是我们之前在函数逼近中提到的truncated power basis与B-spline basis。我们这里十分简要的介绍一下B样条,B样条基下的函数逼近可以写为:\[ f(x)=\beta_0+\beta_1 x+\cdots+\beta_p x^p+\sum_{j=1}^n \beta_j B_j^p(x) \]其中\[ B_i^p(x)=\frac{x-c_i}{c_{i+p}-c_i}B_{i}^{p-1}(x)+\frac{c_{i+p+1}-x}{c_{i+p+1}-c_{i+1}}B_{i+1}^{p-1}(x) \]上式中\( B_i^0(x) =1 \)当且仅当\( c_i \le x<c_{i+1} \)否则取0.在R中splines包的函数bs()提供了B样条估计,其调用格式为:

bs(x, df = NULL, knots = NULL, degree = 3, intercept = FALSE, Boundary.knots = range(x))

对于参数df值得说明的是df=degree+(Knots个数),attr(,“knots”)会显示划分点,我们常用的3次B样条公式: df=k+3 (不含常数项)
我们以前面提到的essay data为例说明B样条的估计情况:

easy <- read.table("D:/R/data/easysmooth.dat", header = T)
x <- easy$X
y <- easy$Y
m.bsp <- lm(y ~ bs(x, df = 6))


s = function(x) {
    (x^3) * sin((x + 3.4)/2)
}
x.plot = seq(min(x), max(x), length.out = 1000)
y.plot = s(x.plot)
plot(x, y, xlab = "Predictor", ylab = "Response")
lines(x.plot, y.plot, lty = 1, col = 1)
lines(x, fitted(m.bsp), lty = 2, col = 2)

attr(bs(x, df &#
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值