数据挖掘
文章平均质量分 86
天边那颗星_2008
这个作者很懒,什么都没留下…
展开
-
数据挖掘十大经典算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法,其实参加评选的18种算法,原创 2013-04-18 22:58:32 · 598 阅读 · 0 评论 -
数据挖掘十大经典算法(1) C4.5
机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。从数据产生决策树的机器学习技术叫做决策树学习, 通俗说就是决策树。决策树学习也是数据挖掘中一个普通的转载 2013-04-18 23:00:37 · 461 阅读 · 0 评论 -
数据挖掘十大经典算法(2) The k-means algorithm
k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k 假设有k个群组Si, i=1,2,...,k。μi是群组Si内所有元素xj的重心,或叫中心点。 k平均聚类发明于1956年, 该算法最常见的形式是采用被称为劳埃德算法(Lloyd algorithm)的迭代式改进探索法。劳埃德算法首先把输入点分成k个初始化分组,可以是随机的或者使用一些转载 2013-04-18 23:02:30 · 1198 阅读 · 0 评论 -
关于SQL Server2008中提供的9种常用的数据挖掘算法
在sql server2008中提供了9种常用的数据挖掘算法,这些算法用在不同数据挖掘的应用场景下,下面我们就各个算法逐个分析讨论。 1.决策树算法 决策树,又称判定树,是一种类似二叉树或多叉树的树结构。决策树是用样本的属性作为结点,用属性的取值作为分支,也就是类似流程图的过程,其中每个内部 节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个树叶节点代表类或类分布。转载 2013-04-18 23:05:30 · 1680 阅读 · 0 评论 -
UCI机器学习数据库使用说明
UCI机器学习数据库的网址: http://archive.ics.uci.edu/ml/数据库不断更新至2010年,是所有学习人工智能都需要用到的数据库,是看文章、写论文、测试算法的必备工具。数据库种类涉及生活、工程、科学各个领域,记录数也是从少到多,最多达几十万条。UCI数据可以使用matlab的dlmread或textread读取,不过,需要先将不是数字的类别用数字转载 2013-11-24 22:16:23 · 11230 阅读 · 0 评论 -
kmeans函数使用实例
前言 一提到聚类算法,必然首先会想到的是kmeans聚类,因为它的名气实在太大了。既然这样,OpenCV中这个函数也自然必不可少了。这节内容主要是讲讲OpenCV中kmeans函数的使用方法。 开发环境:OpenCV2.4.3+QtCreator2.5.1 实验基础 在使用kmeans之前,必须先了解kmeans算法的2个缺点:第一是必须人为指定所聚的类的个数k;第二转载 2013-11-25 22:34:22 · 1188 阅读 · 0 评论 -
OpenCV K均值代码笔记
K均值聚类算法在Opencv的cxcore中,它可以找到数据的自然类别。最为常用的聚类技术之一,它可以迅速找到“类别”中心,将数据进行聚类。 我们可以从图中了解K均值算法的聚类过程: (a) 随机放置聚类中心(圆),将数据样本(小方块)聚到离它最近的中心(即连线) (b) 数据中心移到它所在类别的中心转载 2013-11-25 19:00:43 · 639 阅读 · 0 评论 -
谱聚类算法
谱聚类算法建立在谱图理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。原创 2014-04-24 10:31:05 · 4166 阅读 · 1 评论