SPSS的算法介绍与实现

最新推荐文章于 2024-05-05 23:03:08 发布

亿是守候 & 亿是承诺

最新推荐文章于 2024-05-05 23:03:08 发布

阅读量2.6k

点赞数 1

分类专栏：大数据文章标签：大数据

本文链接：https://blog.csdn.net/weixin_48678602/article/details/109371719

版权

大数据专栏收录该内容

41 篇文章 20 订阅

订阅专栏

文章目录

1.聚类分析
- 1.1 K-均值聚类
- 1.2 系统聚类
2.主成分分析
3.时间序列

本文介绍一些常用的算法和如何使用SPSS实现

1.聚类分析

1.概述
聚类分析(cluster analysis)也称群分析、点群分析，是一种无监督学习，与回归分析、多元分析称为多元分析的三大方法。是一个把数据对象划分成子集的过程。每个子集是一个簇(cluster)，使得簇中的对象彼此相似，但是与其他簇中的对象不相似。由聚类分析产生的一个簇的集合叫做一个聚类。

2.基本思想：
我们所研究的样品或指标（变量）之间存在程度不同的相似性（亲疏关系——以样品间距离衡量）。于是根据一批样品的多个观测指标，具体找出一些能够度量样品或指标之间相似程度的统计量，以这些统计量为划分类型的依据。把一些相似程度较大的样品（或指标）聚合为一类，把另外一些彼此之间相似程度较大的样品（或指标）又聚合为另一类，直到把所有的样品（或指标）聚合完毕，满足“类内差异小，类间差异大”，这就是分类的基本思想。也就是“物以类聚”的思想。

在这里插入图片描述

3.聚类分析的步骤

步骤1：选择聚类分析变量；

这些变量应具备以下特点：
1）和聚类分析的目标相关；
2）反映了要分类对象的特征；
3）在不同对象的值具有明显差异；
4）变量之间不应该高度相关
对于变量高度相关的处理办法（两种）：
1）在对案例聚类分析之前，先对变量进行聚类分析，在各类中选择具有代表性的变量作为聚类变量；
2）对变量做因素分析，产生一组不相关变量作为聚类变量。
步骤2：计算相似性
相似性(Similarity)是聚类分析的一个基本概念，反映了研究对象之间的亲疏程度。聚类分析就是根据研究对象之间的相似性来进行分类的。
步骤3：聚类
选定聚类方法，确定形成的类数。

步骤4：聚类结果的解释
得到聚类结果后，对结果进行验证和解释，以保证聚类解是可信的。
聚类分析的特征：

分组：聚类分析的过程就是把一个数据对象分成若干个组(或者簇)的过程。

相似：组内的对象具有很高的相似性，而对于另外一些组，则要求尽可能的不相似。

评估：聚类完成后，还需要一些评价函数对聚类结果进行度量，通常涉及距离度量。

具体几种距离算法可见：聚类分析理论介绍

1.1 K-均值聚类

案例
在这里插入图片描述

结果：

在这里插入图片描述

1.2 系统聚类

在这里插入图片描述

2.主成分分析

在这里插入图片描述

3.时间序列

先定义数据
在这里插入图片描述

点击确定

结果：

4.神经网络
5.多元线性回归
6.logistic回归
后面再补充…

亿是守候 & 亿是承诺

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
SPSS的算法介绍与实现

本文介绍一些常用的算法和如何使用SPSS实现1.聚类分析1.概述聚类分析(cluster analysis)也称群分析、点群分析，是一种无监督学习，与回归分析、多元分析称为多元分析的三大方法。是一个把数据对象划分成子集的过程。每个子集是一个簇(cluster)，使得簇中的对象彼此相似，但是与其他簇中的对象不相似。由聚类分析产生的一个簇的集合叫做一个聚类。2.基本思想：我们所研究的样品或指标（变量）之间存在程度不同的相似性（亲疏关系——以样品间距离衡量）。于是根据一批样品的多个观测指标，具体找出一些
复制链接

扫一扫

专栏目录