自己救自己系列,不然要没工作了,我太难了。
莪只是个木得感情的搬运机器,以下内容都附有原链接地址,你不想我搬运的话,可以联系我删除好勒。
红色加粗是我见了好多次,感觉经常会考得点。
感觉决策树是很常考的内容,所以一定要注意!!
1、决策树必考的---介绍决策树三种算法
1) ID3 的构造准则是信息增益
2) C4.5的构造准则是信息增益比
3) CART(classfication and regression tree, 分类与回归树)
分类问题的构造准则为基尼指数
回归问题的构造准则为信息增益比
公式要记,具体详见: https://blog.csdn.net/lrs1353281004/article/details/87448456
2、3种算法的区别,优缺点,应用场景。
区别和优缺点可以参考这篇讲决策树的知乎文章 https://zhuanlan.zhihu.com/p/85731206
3、决策树处理连续值的方法;
我觉得: 即上面文章中讲回归的具体做法
4、决策树如何后剪枝
附问题:欲剪枝,后剪枝,及其比较 https://blog.csdn.net/u014697805/article/details/78636135
更深一点的剪枝算法:https://www.jianshu.com/p/794d08199e5e
补充一个讲决策树的知乎文章 https://zhuanlan.zhihu.com/p/85731206
好像就这么点?因为决策树主要会和RF, GBDT,XGBoost之类一起考,等复习到以后再有补充继续更
其他相关内容链接:
1、机器学习相关准备知识
1.1 SVM算法面试问题汇总 (机器学习必考)
1.2 决策树算法面试问题汇总
1.3 逻辑回归(LR)算法面试问题汇总
1.4 KNN算法面试问题汇总
1.5 集成学习算法面试问题汇总(含RF,AdBoost,GBDT )
3、编程相关准备知识(我用的C++)
3.1 set基本定义与使用
3.2 map基本定义与使用
3.3 vector数组基本定义与使用
3.4 string基本定义与使用
3.5 stack基本定义与使用