- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 FP-growth算法
FP增长算法Apriori原理是说如果一个元素项是不频繁的,那么那些包含该元素的超集也是不频繁的。Apriori算法从单元素项集开始,通过组合满足最小支持度要求的项集来形成更大的集合。支持度用来度量一个集合在原始数据中出现的频率。 FP-growth算法基于Apriori构建,但采用了高级的数据结构减少扫描次数,大大加快了算法速度。FP-growth算法只需要对数据库进行两次扫描,而Aprior
2016-12-15 11:51:15 889
转载 聚类算法birch详解
BIRCH算法 BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)全称是:利用层次方法的平衡迭代规约和聚类,采用了一种多阶段聚类技术,是层次聚类和其他聚类算法的集成。BIRCH是一种基于距离的层次聚类算法,它最大的特点是能利用有限的内存资源完成对大数据集的高质量的聚类,同时通过单遍扫描数据集能最小化I/O代价。
2016-12-09 09:57:18 2008
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人