- 博客(3)
- 收藏
- 关注
原创 RF,GBDT,xgboost 区别
1、RF与GBDT之间的区别 相同点 都是由多棵树组成 最终的结果都是由对棵树一起决定 不同点 组成随机森林的数可是分类树也可以是回归树,而GBDT只由回归树组成 组成随机森林的数可是并行生成,而GBDT只能是串行生成 随机森林的结果是多棵树表决决定,而GBDT则是多棵树累加之和 随机森林对异常值不敏感,而GBDT对异常值比较敏感 随机森林是通过减少模型的方差来提高性能,而GBDT是减少模型的偏差...
2018-12-14 19:57:17 558
原创 回归树和分类树区别
分类树 以C4.5分类树为例,C4.5分类树在每次分枝时,是穷举每一个feature的每一个阈值,找到使得按照feature<=阈值,和feature>阈值分成的两个分枝的熵最大的阈值(熵最大的概念可理解成尽可能每个分枝的男女比例都远离1:1),按照该标准分枝得到两个新节点,用同样方法继续分枝直到所有人都被分入性别唯一的叶子节点,或达到预设的终止条件,若最终叶子节点中的性别不唯一,则以...
2018-12-13 19:53:27 5269
原创 KNN基本实现
import numpy as np import collections import operator def dataSet(): group=np.array[[1,201],[2,302],[20,230],[30.400],[2,600]] labels=[‘爱情片’,‘爱情片’,‘动作片’,‘动作片’] return group,labels def classify0(index,...
2018-12-13 19:50:57 152
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人