advancedos
Stupid-Tyro
这个作者很懒,什么都没留下…
展开
-
关联规则中APRIORI算法
APRIORI算法频繁项集APRIORI算法通过迭代来计算数据库中频繁项集,第i次迭代计算所有频繁i项集支持度:DB中含有s%的事务包含候选集例id项1ACD2BCE3ABCE4BE第一次得到项集计数支持度A250%C375%D125%B375%若取支持度为50%,则剩AC...原创 2019-05-10 10:34:18 · 349 阅读 · 0 评论 -
FP-growth频繁模式增长方法
FP-growth频繁模式增长方法先进行数据库投影,得到频繁项然后通过构造一个压缩的数据库结构–FP树来对它们进行挖掘首先扫描数据库,得到频繁项的列表,频繁项集按支持度计数的递减顺序排序,创建树的根部,第二次扫描数据库,对第一个事务的扫描可以得到树的第一个分支,只有那些在频繁项集中的项才会被选中,分支中节点的计数代表了树中该节点项所出现的次数,增加计数节点排列顺序按照项集列表中的顺序...原创 2019-05-10 12:06:56 · 647 阅读 · 0 评论 -
python实现fpgrowth ----持续更新
创建FP树的数据结构class treeNode: def __init__(self,nameValue,numOccur,parentNode): self.name = nameValue self.count = numOccur self.nodeLink = None ...原创 2019-05-10 17:07:49 · 1708 阅读 · 0 评论 -
windows下spark环境的搭建
1.下载JDKJDK安装 E:\advancedos\JDK配置环境: 添加E:\advancedos\JDK\bin至系统变量和环境变量中验证:java -version2.下载scalascala直接安装,默认添加至环境变量中3.下载sparkspark解压,添加至环境变量中将spark文件夹取消只读,并在安全中设置为完全控制4.下载hadoop2.7ha...原创 2019-05-22 15:08:24 · 86 阅读 · 0 评论