数据挖掘
波波的一天
土土的土豆,不喜欢吃兔兔
展开
-
主成分分析(PCA)
主成分分析(PCA)我们希望将N维数据降低为K维数据,对数据简化有如下一系列原因:1 使得数据集更易使用使用2 降低很多算法的计算开销3 去除噪声4 使得结果易懂 在所有的降维技术中,PCA的应用目前最为广泛,在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个...原创 2018-11-14 12:51:43 · 295 阅读 · 0 评论 -
层次聚类
层次聚类算法的工作流程如下。首先,每个点自己单独看成一个簇。随着时间的推移,算法会通过合并两个小簇而形成一个大簇。算法流程首先,我们假定算法运行在欧式空间下。此时可以允许通过簇质心或者簇内平均点来表示一个簇。注意到对于单点组成的簇,该点就是簇质心,因此可以很直观地对这些簇进行初始化。然后我们将簇之间距离定义为其质心之间的欧氏距离,并选择具有最短距离的两个簇进行合并。簇之间的距离有很多...原创 2019-03-18 15:42:23 · 631 阅读 · 0 评论 -
序列模式挖掘
算法1-1 AprioriAll算法输入:大项集阶段转换后的序列数据库DT输出:所有最长序列伪代码(1) L1={large 1-sequences};// 大项集阶段得到的结果(2) FOR(k=2;Lk-1 ;k++) DO BEGIN(3) Ck=apriori-gen(Lk-1); // Ck是从Lk-1中产生的新的候选者(4) FOR each c...原创 2019-04-20 20:27:22 · 1114 阅读 · 0 评论