- 博客(4)
- 收藏
- 关注
转载 Aprior算法简化算法——FP-Tree思想与实现
在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概念。设事务数据库为:
2015-09-23 14:17:00 834
原创 FP-Growth算法
1.FP-Growth算法 FP-Growth算法(Frequent Pattern-growth)使用了一种紧缩的数据结构频繁模式树(Frequent Pattern tree,简称FP-Tree)来存储查找频繁项集所需要的全部信息。2.FP-tree (1)FP-tree是一种特殊的前缀树,其是满足下列条件的一个树结构:它由一个根节点(值为null)
2015-09-23 10:32:25 3928
原创 Hadoop的局限性
1、抽象层次低,需要手工编写代码来完成,使用上难以上手;2、只提供两个操作,Map和Reduce,表达力欠缺;3、一个Job只有Map和Reduce两个阶段(Phase),复杂的计算需要大量的Job完成,Job之间的依赖关系是由开发者自己管理的;4、处理逻辑隐藏在代码细节中,没有整体逻辑;5、中间结果也放在HDFS文件系统中;6、ReduceTask需要等待所有MapTask都完成后才可
2015-09-21 12:33:55 3107
转载 php使用php include之后页首有空白
1.今天做这一个页面的时候发现如果使用BOM: Byte Order MarkUTF-8 BOM又叫UTF-8 签名,其实UTF-8 的BOM对UFT-8没有作用,是为了支援UTF-16,UTF-32才加上的BOM,BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别,但是BOM虽然在编辑器中不显示,但是会产生输出,就像多了一个空行。 2.但是加了这个之后页面上有乱码
2015-09-13 20:55:16 929
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人