![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
ljhlfy
这个作者很懒,什么都没留下…
展开
-
熵对分类决策树的划分
刚刚学数据挖掘,在看数据预处理时,看到熵是最常用于确定划分点的度量。最开始理解以为熵就是作为一个分类的依据,维基后发现熵最开始于物理的热力学,是指能量的均匀。熵越大越均匀,后发展用于信息,统计学。那么熵怎么用于分类决策树划分呢?首先有公式如下:信息熵越大表示含信息量越多下面是计算信息熵的方法,以及测试代码:第一个函数试计算信息熵,第二个函数创建数据转载 2013-11-25 20:06:53 · 874 阅读 · 0 评论 -
Apriori&FP算法
Apriori算法和FPTree算法都是数据挖掘中的关联规则挖掘算法,处理的都是最简单的单层单维布尔关联规则。转自http://blog.csdn.net/sealyao/article/details/6460578Apriori算法Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。是基于这样的事实:算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜转载 2013-11-29 13:56:45 · 740 阅读 · 0 评论 -
数据挖掘 数据集资源
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htm转载 2014-01-26 18:49:18 · 592 阅读 · 0 评论