- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 Spark GBDT
随机森林(random forest)和GBDT都是属于集成学习(ensemble learning)的范畴。集成学习下有两个重要的策略Bagging和Boosting。 Bagging算法是这样做的:每个分类器都随机从原样本中做有放回的采样,然后分别在这些采样后的样本上训练分类器,然后再把这些分类器组合起来。简单的多数投票一般就可以。其代表算法是随机森林。Boosting的意思是这样,他通过
2017-11-09 16:51:40 1671
spark-redis connector
spark对Redis原生的支持,可支持对Redis的各种操作 eg:sc.toRedisKV(saveRedisRDD),
配置如下
conf.set("redis.host","localhost")
conf.set("redis.prot","6379")
2017-09-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人