- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 数据挖掘算法总结
一、关联规则挖掘1、 Apriori算法(1)Apriori算法原理Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规
2015-04-20 23:48:20 1715
原创 Yarn的资源调度与erlang进程调度二三事
Yarn资源调度器1、Capacity scheduler 设计目的:以队列为单位划分资源,旨在让分布式集群资源被多用户共享,被多application共享,不同队列间可以动态迁移资源,避免资源被单个应用或单个用户独占,提高集群资源吞吐量和利用率。 核心思想:传统多个独立集群各占一组机器资源以备不时之需,拥有各自的管理开销,这通常导致比较差的资源利用率
2015-04-03 23:35:11 895
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人