树回归、线性回归、Logitic回归

最新推荐文章于 2024-07-17 12:01:30 发布

leiyufei

最新推荐文章于 2024-07-17 12:01:30 发布

阅读量2k

点赞数 5

文章标签：树回归、线性回归、Logistic回归、Logistic回归算法推导

本文链接：https://blog.csdn.net/leiyufei/article/details/83958093

版权

本文详细介绍了树回归中的CART算法，包括回归树和分类树的生成原理。接着，讨论了线性回归的不同方法，如普通最小二乘法、局部加权线性回归、岭回归和前向逐步回归。最后，深入探讨了Logistic回归，解释了其模型参数估计过程，并提到了最大似然估计法和梯度上升算法在模型训练中的应用。

摘要由CSDN通过智能技术生成

树回归

分类与回归树（classification and regression tree，CART）即可用于分类也可以用于回归，由特征选择、树的生成及剪枝组成，一般简称为决策树。

CART生成

决策树的生成就是递归地构建二叉决策树的过程。对回归树用平方误差最小化准则，对分类树用基尼指数（Gini index）最小化准则，进行特征选择，生成二叉树。

回归树的生成

回归树用平方误差最小化准则，所以又称它为最小二乘回归树。
最小二乘回归树生成算法
输入：训练数据集 $D$ ；
输出：回归树 $f (x)$ 。
在训练数据集所在的输入空间，递归将每个区域划分为两个子区域并决定每个子区域上的输出值，构建二叉决策树；
（1）选择最优切分变量 $j$ 与切分点 $s$ ，求解：
$\begin{array}{ll} \min_{j,s} \left[\sum_{x_i \in R_1(j,s)}(y_i - c_1)^2 + \sum_{x_i \in R_2(j,s)}(y_i - c_2)^2 \right] \qquad \qquad \text{(5.12)}\\[2ex] c_1 = ave(y_i | x_i \in R_1(j,s)) \\[2ex] c_2 = ave(y_i | x_i \in R_2(j,s)) \end{array}$ 遍历变量 $j$ ，对固定的切分变量 $j$ 扫描切分点 $s$ ，选择使式(5.21)达到最小值得对 $(j, s)$ 。
（2）用选定的对 $(j, s)$ 划分区域并决定相应的输出值
$\begin{array}{ll} R_1(j,s)=\{x|x^{(j)} \leqslant s\}\\[2ex] R_2(j,s)=\{x|x^{(j)} \gt s\} \\[2ex] \hat c_m = \frac1{N_m}\sum_{x_i \in R_m(j,s)}y_i, \quad x \in R_m, \quad m=1,2 \end{array}$