连续变量的可视化分段
文章目录
前言
分段意义:
- 符合实际情况,比如,在临床医学中,将年龄分为老、中、青三类。
- 细致的刻画出变量与因变量的关联,比如,有些疾病的发生与年龄不是线性的关系,是曲线或者其它关系,此时将年龄变量分为n分段,有利于刻画自变量和因变量的关系。
- 上一节的重编码过程其实也可以用于分箱过程,它可以随意分段,但是不方便,需要一个组段一个组段的一对一。
对于没有那么复杂,没有那么精细要求的分段,SPSS提供了2个对话框界面
1.数值变量的离散化分段(分箱)
概述:
- 希望用简单的方法进行分段时使用,比如:等距分、等量分;
- 在可视界面下将连续变量进行分段,可直观的看到分段效果;
- 在分段时,可以使用等间距、百分位数、标准差范围进行分段操作。
例:将年龄变量S3分段