![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
文章平均质量分 69
sinat_34788899
这个作者很懒,什么都没留下…
展开
-
决策树
看了网上的一些资料和例子1.决策树的基本流程2.决策树的属性划分选择以下几种指标与属性分支的纯度有关ID3:信息增益C4.5:信息增益率CART:基尼指数3.剪枝处理 是决策树对付“过拟合”的主要手段; 先剪枝:决策树生成过程中,对每个节点划分前先进行估计,看当前划分的节点能否带来泛化性能提升。 后剪枝:先生成一颗完整的树,自底向上对飞叶节点进行考原创 2017-01-04 10:20:17 · 169 阅读 · 0 评论 -
spark滑动分窗问题
在使用spark计算时,有时候要对dataframe分窗。但是。。。。。并不是所有的情况都适合分窗。 1.不适合分窗:结果RDD(dataFrame),这个往回倒不好倒啊:事实证明,每个小窗结果为dataframe这样的情况不适合分窗!! 2.适合分窗:均值滤波和ARIMA这样的,每个小窗出一个数或者一个数组的才方便使用分窗 分窗真的可以并行计算么? 目前实现的是A原创 2017-01-05 16:01:23 · 670 阅读 · 0 评论