SPSS的算法介绍与实现


本文介绍一些常用的算法和如何使用SPSS实现

1.聚类分析

1.概述
聚类分析(cluster analysis)也称群分析、点群分析,是一种无监督学习,与回归分析、多元分析称为多元分析的三大方法。是一个把数据对象划分成子集的过程。每个子集是一个簇(cluster),使得簇中的对象彼此相似,但是与其他簇中的对象不相似。由聚类分析产生的一个簇的集合叫做一个聚类。

2.基本思想:
我们所研究的样品或指标(变量)之间存在程度不同的相似性(亲疏关系——以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,满足“类内差异小,类间差异大”,这就是分类的基本思想。也就是“物以类聚”的思想。

在这里插入图片描述

3.聚类分析的步骤

步骤1:选择聚类分析变量;

这些变量应具备以下特点:
1)和聚类分析的目标相关;
2)反映了要分类对象的特征;
3)在不同对象的值具有明显差异;
4)变量之间不应该高度相关
对于变量高度相关的处理办法(两种):
1)在对案例聚类分析之前,先对变量进行聚类分析,在各类中选择具有代表性的变量作为聚类变量;
2)对变量做因素分析,产生一组不相关变量作为聚类变量。
步骤2:计算相似性
相似性(Similarity)是聚类分析的一个基本概念,反映了研究对象之间的亲疏程度。聚类分析就是根据研究对象之间的相似性来进行分类的。
步骤3:聚类
选定聚类方法,确定形成的类数。

步骤4:聚类结果的解释
得到聚类结果后,对结果进行验证和解释,以保证聚类解是可信的。
聚类分析的特征:

分组:聚类分析的过程就是把一个数据对象分成若干个组(或者簇)的过程。

相似:组内的对象具有很高的相似性,而对于另外一些组,则要求尽可能的不相似。

评估:聚类完成后,还需要一些评价函数对聚类结果进行度量,通常涉及距离度量。

具体几种距离算法可见:聚类分析理论介绍

1.1 K-均值聚类

案例
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
结果:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.2 系统聚类

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.主成分分析

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.时间序列

先定义数据
在这里插入图片描述
在这里插入图片描述
点击确定
在这里插入图片描述
在这里插入图片描述
结果:
在这里插入图片描述

4.神经网络
5.多元线性回归
6.logistic回归
后面再补充…

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值