数据挖掘
姹紫_嫣红
生活也好,工作也好,本来就是消磨人的事儿,要在被消磨之间反身抗衡是需要勇气的。
博客园:http://www.cnblogs.com/xleer/
展开
-
数据挖掘之分类算法
分类是数据挖掘、机器学习和模式识别中一个重要的研究领域。单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;还有用于单一分类方法的集成学习算法,如Bagging和Boosting等。(1)决策树主要用于分类和预测的技术之一,是以实例为基础的归纳学习算法,从一组无次序、无规则的实例中推理出决策树表示的分类规则。目的是找出属性和类别间的关系,用它来预测将来...转载 2018-05-17 20:49:30 · 1076 阅读 · 0 评论 -
数据挖掘之关联规则
在数据挖掘的知识模式中,关联规则模式是比较重要的一种。属于描述性模式,发现关联规则的算法属于无监督学习的方法。关联规则通过量化的数字描述物品甲的出现对物品乙的出现有多大的影响。一般用4个参数来描述关联规则的属性:1.可信度(子集)可信度是指出现了物品集A的事务T中,物品集B也同时出现的概率有多大。比如:如果一个顾客购买了铁锤,那么他也购买铁钉的可能性有多大呢?可信度:购买铁锤的顾客中有70%的人购...转载 2018-05-17 11:21:21 · 2904 阅读 · 0 评论 -
关联分析-FP-growth算法
关联分析:即从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联规则学习;存在的问题;寻找物品的不同组合是一项十分耗时的任务,所需要的计算代价很高,暴力搜索不能解决问题。关联分析是用于发现大数据集中元素有趣关系的一个工具集,可以采用两种方式来量化这些有趣的关系。1.给出频繁项集,给出经常出现在一起的元素项;2.给出关联规则,每条关联规则意味着元素项之间的“如果....那么...”关系;FP-...原创 2018-05-16 10:54:57 · 713 阅读 · 0 评论