数据挖掘
zhaosarsa
C'est la vie
Carpe diem
展开
-
【机器学习】数据挖掘算法——关联规则(三),FP-growth算法
前言 上一篇文章介绍了用来挖掘发现强关联规则的Apriori算法。同时也知道了Apriori算法在实现过程中由于需要频繁的扫描数据集导致效率较低。 FP-growth算法基于Apriori构建,但采用了高级的数据结构减少扫描次数,大大加快了算法速度。FP-growth算法只需要对数据库进行两次扫描,而Apriori算法对于每个潜在的频繁项集都会扫描数据集判定给定模式是否频繁,因此FP-gr...转载 2018-10-28 15:23:16 · 1432 阅读 · 0 评论 -
【机器学习】数据挖掘算法——关联规则(一),相关概念,评价指标
综述:数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间可能存在的关联或者联系。关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也...原创 2018-10-27 11:23:43 · 10573 阅读 · 1 评论 -
【机器学习】数据挖掘算法——关联规则(二),挖掘过程,Aprioir算法
关联规则挖掘的原理和过程从关联规则(一)的分析中可知,关联规则挖掘是从事务集合中挖掘出这样的关联规则:它的支持度和置信度大于最低阈值(minsup,minconf),这个阈值是由用户指定的。根据support=(X,Y).count/T.countsupport=(X,Y).count/T.countsupport=(X,Y).count/T.countconfidence=(X,Y).co...原创 2018-10-27 19:24:53 · 4001 阅读 · 0 评论 -
【机器学习】主题模型
主题模型(LDA)(一)–通俗理解与简单应用主题模型(LDA)(二)-公式推导主题模型-LDA浅析(简短清楚)通俗理解LDA主题模型(超详细)数学之美(上一篇的参考文章)plsa和LDA的区别–七月在线...转载 2018-11-01 21:34:42 · 735 阅读 · 0 评论