- 博客(6)
- 收藏
- 关注
原创 决策树cart
decision tree基本概念熵(entropy)基尼指数(Gini index)example决策的可能个数CART分类树剪枝回归树引:决策树是一种基本的分类和回归算法,思想非常简单,给出一个总体衡量复杂度的公式,然后在使用贪心算法,用局部最优来近似总体最优,并设置终止条件,最后通过剪枝避免过拟合。优点是模型具有可读性,分类速度快(二叉树)。基本概念熵(entropy)和基尼指数(Gini index)都是表示随机变量不确定性的度量(针对离散情况,因此是用于分类问题的度量)熵(entrop
2021-06-03 16:48:05
568
原创 Targeted Maximum Likelihood Estimation
TMLE相关性和因果性TMLE(Targeted Maximum Likelihood Estimation)相关性和因果性传统的统计和机器学习模型往往是考虑相关性,但是不考虑因果性。相关性单纯指出A和B是有联系的,而因果性会指出是由于A导致了B还是由于B导致了A。气温升高导致了冰淇淋的销量和啤酒的销量的增加,两者是因果性的关系。冰淇淋的销量和啤酒的销量的增加虽然有强相关,但是两者都是受气温驱动,两者没有因果联系。关于因果推断的相关问题,由于当前知识所限,会在之后继续补充。TMLE(Targe
2021-05-29 01:46:16
1125
原创 Orthogonal greedy algorithm降维
Orthogonal greedy algorithmboostingBOOSTING FOR HIGH-DIMENSIONAL LINEAR MODELSOrthogonal greedy algorithmOGA的R语言代码OGALassoTwohitReferencesOGA是一种对回归模型进行降维的方法,它的思想易于理解,简单来说就是选择最大化削减残差的变量,L2 boosting is thus nothing else than repeated least squarestting of
2021-05-14 01:21:20
659
原创 reduced rank regression model
Multivariate linear regression is a natural extension of multiple linear regression in that both techniques try to interpret possible linear relationships between certain input and output variables. Multiple regression is concerned with studying to what e.
2021-05-12 15:25:20
1056
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人