广义加性模型和树模型

最新推荐文章于 2023-11-07 21:19:41 发布

杲昃

最新推荐文章于 2023-11-07 21:19:41 发布

阅读量5.4k

点赞数 1

分类专栏： ESL

ESL 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

广义加性模型

传统线性模型所面临的问题：
在现实生活中，变量的作用通常不是线性的。

广义加性模型是一种自由灵活的统计模型，它可以用来探测到非线性回归的影响。模型如下：

E (Y | X 1, . . ., X p) = α + f 1 (X 1) + f 2 (X 2) + . . . + f p (X p)

$E(Y|X_1,...,X_p)=\alpha+f_1(X_1)+f_2(X_2)+...+f_p(X_p)$

$X_1,...,X_p$ 是预测器(predictor)，其实就是自变量；
$Y$ 是输出；
$f_j$ 是非参数函数；
$\alpha和f_j()是要估计的$ ；

直观的理解就是，模型放松了对 $X$ 是线性的要求，可以对每个自变量进行非线性的变换。

树模型

感觉ESL里的树模型和决策树的思想类似。

二者都是根据自变量 $X$ 来对原始输入空间进行划分。然后使用相应的函数来检测划分子集的纯度怎么样，一次来判断划分的好坏。

《统计学习方法》里说可以将决策树看作是 $if-then$ 规则，每条路径构建一条判别规则。任意一个实例都被且仅被一条路径覆盖。

ESL中损失函数定义为：

C α (T) = \sum m = 1 | T | N m Q m (T) + α | T |

$C_\alpha(T)=\sum^{|T|}_{m=1}N_mQ_m(T)+\alpha|T|$

$T$ 代表树模型， $|T|$ 代表叶子的个数；
$N_m$ 代表第 $m$ 个叶子中的实例个数；
$\hat{c}_m=\frac{1}{N_m}\sum_{x_i\in R_m}y_i$ ；
$Q_m(T)=\frac{1}{N_m}\sum_{x_ \in R_m}(y_i-\hat c_m)^2$ ；
$\alpha|T|$ 是用来做剪枝，控制复杂度用的；

小插曲：
前面的文章曾经介绍过分段多项式：
这里写图片描述

我感觉这个图可以看成是只有一个连续属性的决策树，即 $X\in\mathbb{R}$ 。这里对划分结点的选择是一个值得探讨的问题。这个问题在 $knots$ 选择里应该有涉及。

决策树又可分为回归和分类两类，区别在于选取划分点和划分自变量上。对于回归可以使用：

m i n j, s [m i n c 1 \sum x i \in R 1 (j, s) (y i - c 1) 2 + m i n c 2 \sum x i \in R 2 (j, s) (y i - c 2) 2]

$min_{j,s}[min_{c_1}\sum_{x_i\in R_1(j,s)}(y_i-c_1)^2+min_{c_2}\sum_{x_i\in R_2(j,s)}(y_i-c_2)^2]$

$j$ 是划分变量；
$s$ 是划分点；

分类问题可以使用信息增益，基尼指数，增益率等等来做。

参考文章: ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记（十二）

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
广义加性模型和树模型

广义加性模型传统线性模型所面临的问题：在现实生活中，变量的作用通常不是线性的。广义加性模型是一种自由灵活的统计模型，它可以用来探测到非线性回归的影响
复制链接

扫一扫

专栏目录

杲昃 CSDN认证博客专家 CSDN认证企业博客

码龄9年

24: 原创

18万+: 周排名

201万+: 总排名

6万+: 访问

: 等级

980: 积分

15: 粉丝

35: 获赞

22: 评论

101: 收藏

私信

关注

热门文章

分类专栏

文本摘要 1篇
写作 1篇
ESL 8篇
kaggle 1篇
MachineLearninginAction 1篇
线性代数 1篇
读论文 2篇
杂感 1篇
书面英语 1篇
python 2篇
NLP 3篇
USACO 8篇
Ubuntu 1篇

最新评论

核光滑方法
吹笛的花衣人: 没推导出来的那个式子就是wls估计
级联相关神经网络
庄生.: 有论文或者代码吗
级联相关神经网络
金焱111: 这个原论文是什么
时间序列分割
weixin_45897472: 博主有没有源代码可以分享一下[code=python] 博主有没有源代码可以分享一下 [/code]
2017 开放学术精准画像大赛 - task2 解决方案
zhongzhong123456: 你好，task3的数据集百度网盘没法下载，能方便发一下吗？非常谢谢！191331583@qq.com

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。