- 博客(5)
- 收藏
- 关注
原创 决策树(二)——集成模型
集成模型Boosted trees:针对之前模型判断错误的实例进行训练,递归生成多个决策树,并加权求和的方法获得集成模型。一种典型方法是AdaBoost.Boostrap aggregated trees:随机有放回的方式取样,搭建多个决策树,并通过投票的方法输出预测结果。一种典型的方法是随机森林。...
2018-12-29 09:39:47 1237
原创 决策树(一)——基础算法
决策树根据wikipedia的定义,决策树学习方法是一种通过决策树实现从某几个特征属性(分枝)到目标值(叶节点)的预测模型。一种实现方法是贪心算法:数据源按照属性测试条件分割为子集,然后在生成的每个子集上递归执行递归分割过程,直到该节点所有子集具有相同的目标变量。用途:分类模型特征选取,属性测试条件(Attribute value tests)最优结果是数据集的强相关特征。CART...
2018-12-26 10:07:24 814
翻译 Cheat sheet FOR Python Packages
Cheat sheet FOR Python PackagesPysparkPandasAnd SO ON
2018-12-20 17:09:33 165
原创 sqlzoo刷题 - SELECT within SELECT Tutorial
SELECT within SELECT Tutorial1.List each country name where the population is larger than that of ‘Russia’.SELECT name FROM worldWHERE population > (SELECT population FROM world WHERE name = 'R...
2018-12-19 08:49:18 230
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人