异构属性特征(连续型和分类型)选择
前言
这段时间试了各种各样的论文方法,复杂度、新颖度都考虑之后,觉得不适合新手使用,下面介绍一种使用SPSS软件进行特征选择的方法,其中包括了原理和操作步骤,供大家学习讨论。
一、SPSS软件介绍
IBM SPSS是目前常用的一种统计分析软件,SPSS(Statistical Product and Service Solutions)是统计产品和服务解决方案软件,操作简单,无需写代码,只需确定要分析数据的因变、自变关系,以及单因素、多因素、混合等分析即可。
SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
对于SPSS下载不懂的小伙伴可以评论里告诉我。
二、案例分析
2.1数据理解
对于异构特征选择,本案例中是选择和并发症最相关的一些特征,因此因变量是二分类的变量,自变量为待选特征,包括了连续特征和分类(有序、无序)特征,需要考虑这样几个问题:
- 对分类变量之间的研究,卡方检验是常用的方法,但只是用卡方检验会遇到两个问题