k均值例子 数据挖掘_DMKD---数据挖掘与知识发现系统

c1a9913d85401cf2bb956c3040bf4320.png

Data Mining and Knowledge Discovery(简称:DMKD)

中文名字:数据挖掘与知识发现

fe9699600149056de913992da9c41ed3.png

01

主成分分析与可视化展示

主成分分析 (PCA, principal component analysis)是一种数学降维方法, 利用正交变换 (orthogonal transformation)把一系列可能线性相关的变量转换为一组线性不相关的新变量, 也称为主成分,从而利用新变量在更小的维度下展示数据的特征。

主成分是原有变量的线性组合,其数目不多于原始变量。组合之后,相当于我们获得了一批新的观测数据,这些数据的含义不同于原有数据,但包含了之前数据的大部分特征,并且有着较低的维度,便于进一步的分析。

距离相近划分一个类别添加标签
由于遮挡,可局部放大主成分分析(三维)

主成分分析需要我们自己根据距离进行划分聚类。那么,能否利用聚类算法进行自动聚类呢?

答案是肯定的!

02

K均值聚类与可视化展示

K均值聚类算法是先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

同一个颜色一个类别带标签聚类
局部放大(同一个颜色一个类别)三维聚类(同一个颜色一个类别)

N维聚类结果是个表,如下:(同一个数字一个类别)

03

网络聚类与可视化展示

同一个颜色一个类别
同一个颜色一个类别

04

关联规则算法挖掘

在描述有关关联规则的一些细节之前,先来看一个有趣的故事:"尿布与啤酒"的故事。

在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对海量交易数据进行挖掘和分析,沃尔玛是不可能发现数据内在这一有价值的规律的。

关联规则定义:

关联规则是形如X→Y的蕴涵式,其中,X和Y分别称为关联规则的先导(antecedent或left-hand-side,LHS)和后继(consequent或right-hand-side,RHS)。关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组(Frequent Itemsets),第二阶段再由这些高频项目组中产生关联规则(Association Rules)。

支持度关联规则挖掘结果
如利用本团队开发的软件需在论文或报告中给予引用说明!软件引用格式例子本文利用DMKD4.0[1]软件进行主成分分析/K均值聚类/社区聚类分析/关联规则......参考文献[1] 学术点滴,文献计量. DMKD---数据挖掘与知识发现系统[EB/OL].(2020-12-21)[2020-12-29].https://mp.weixin.qq.com/s/tq5MyBGGL2rONB_5cfO3jg其中【2020-12-29】为你引用的时间 其他本平台开发的软件引用格式于此类似详情加qq:2088904822咨询
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值