![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
蜗牛_Wolf
有道无术,术可求;无道有术,止于术。
展开
-
EM
统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variable)。最大期望经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。可以有一些比较形象的比喻说法把这个算法讲清楚。比如说食堂的大师傅炒了一份菜,要等分成两份给两个人吃,显然没有必...转载 2018-07-24 07:17:22 · 262 阅读 · 0 评论 -
智能算法---蚁群算法
1 蚁群算法及其基本思想蚁群算法是一种智能优化算法,通过蚁群优化求解复杂问题,ACO在离散优化问题方面有比较好的优越性。 基本思想(以旅行商问题为例) 设置多只蚂蚁,分头并行搜索。 每只蚂蚁完成一次周游后,在行进的路上释放信息素,信息素量与解的质量成正比。 蚂蚁路径的选择根据信息素强度大小(初始信息素量设为相等),同时考虑两点之间的...转载 2018-08-27 06:51:58 · 7828 阅读 · 2 评论 -
蚁群算法
阅读目录1.关于旅行商(TSP)问题及衍化 2.群蚁算法基本原理 3.群蚁算法的基本流程 4.群蚁算法计算实例 5.TSP问题的群蚁算法C#代码实现 6.资源与参考文献 若干年前读研的时候,学院有一个教授,专门做群蚁算法的,很厉害,偶尔了解了一点点。感觉也是生物智能的一个体现,和遗传算法、神经网络有异曲同工之妙。只不过当时没有实际需求学习,所以没去研究。最近有一个这样的任务,所以...转载 2018-08-27 06:35:38 · 24547 阅读 · 6 评论 -
GA
遗传算法的手工模拟计算示例为更好地理解遗传算法的运算过程,下面用手工计算来简单地模拟遗传算法的各 个主要执行步骤。 例:求下述二元函数的最大值: (1) 个体编码 遗传算法的运算对象是表示个体的符号串,所以必须把变量 x1, x2 编码为一种 符号串。本题中,用无符号二进制整数来表示。 因 x1, ...转载 2018-08-22 19:17:39 · 223 阅读 · 0 评论 -
粗糙集算法
面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述? 粗糙集合论回答了上面的这些问题。要想了解粗糙集合论的思想,我们先要了解一下什么叫做知识?假设有8个积木构成了一个集合A,我们记:A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分...转载 2018-08-10 06:16:33 · 11716 阅读 · 3 评论 -
BIRCH
1. BIRCH概述 BIRCH的全称是利用层次方法的平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering Using Hierarchies),名字实在是太长了,不过没关系,其实只要明白它是用层次方法来聚类和规约数据就可以了。刚才提到了,BIRCH只需要单遍扫描数据集就能进行聚类,那它是怎么做到的呢? BIRCH算法利...转载 2018-08-01 06:07:56 · 1351 阅读 · 0 评论 -
PrefixSpan
1. 项集数据和序列数据 首先我们看看项集数据和序列数据有什么不同,如下图所示。 左边的数据集就是项集数据,在Apriori和FP Tree算法中我们也已经看到过了,每个项集数据由若干项组成,这些项没有时间上的先后关系。而右边的序列数据则不一样,它是由若干数据项集组成的序列。比如第一个序列<a(abc)(ac)d(cf)>,它由a,abc,ac,d,cf共...转载 2018-08-09 07:18:02 · 2895 阅读 · 0 评论 -
FP Tree算法原理总结
FP Tree算法原理总结 在Apriori算法原理总结中,我们对Apriori算法的原理做了总结。作为一个挖掘频繁项集的算法,Apriori算法需要多次扫描数据,I/O是很大的瓶颈。为了解决这个问题,FP Tree算法(也称FP Growth算法)采用了一些技巧,无论多少数据,只需要扫描两次数据集,因此提高了算法运行的效率。下面我们就对FP Tree算法做一个总结。1. FP Tree数...转载 2018-07-26 06:57:19 · 176 阅读 · 0 评论 -
分类决策树
决策树--信息增益,信息增益比,Geni指数的理解决策树 是表示基于特征对实例进行分类的树形结构 从给定的训练数据集中,依据特征选择的准则,递归的选择最优划分特征,并根据此特征将训练数据进行分割,使得各子数据集有一个最好的分类的过程。 决策树算法3要素: 特征选择 决策树生成 决策树剪枝 部分理解: 关于决策树生成决策树的生成过程就是 ...转载 2018-07-19 21:16:19 · 567 阅读 · 0 评论 -
DBSCAN
DBSCAN是一种著名的密度聚类算法,基于一组邻域参数(r,MinPts)来刻画样本的紧密程度。说的通俗点就是以某个样本点为中心,以r为半径进行画圆,在圆内的范围都是邻域范围。 基本概念: (1)r-邻域。对任意Xi属于数据集D,其r邻域包含样本集D中与Xi的距离不大于r的样本,即N(Xi)={Xj属于D,dist(Xi,Xj)<=r}。(其实就是画...转载 2018-08-31 06:49:09 · 4499 阅读 · 0 评论