- 博客(2)
- 收藏
- 关注
原创 集成学习——好而不同
接上一篇《树分类与树回归》,进一步讲解将弱分类器集成强分类器的集成方法。除了对现有理论知识的提炼汇总外,增加了很多自己的理解,请尊重原创。一、集成原理 机器学习常常用来解决分类与回归的问题,我们总是希望找到一个这样模型,它不仅对现有数据具有很好的拟合能力,对测试数据也有优秀的泛化能力,同时希望计算成本越低越好。实际上,对于一个实际问题往往找不到这么完美的解决方案,但是寻找一个表现不那么差的模...
2018-05-15 19:19:25 1502
原创 决策树与树回归
一、决策树步骤:定义评价指标,混乱程度的描述方法——entropy。计算整个数据集的熵划分数据集的最佳方式。遍历所有特征,循环计算熵。选择熵增最大的特征作为划分数据集的节点递归计算树的每一层,直至用完所有特征属性 or 每个分支下的实例都属于相同的分类。(如果遍历完所有属性仍旧未将数据集划分结束,则将其归属为出现最多的类别)需要遍历所有的特征以及特征属性值。二、树回归贪心算法:给定时间内的最佳选择...
2018-05-10 16:08:40 261
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人