SPSS(基础篇04)--连续变量的可视化分段(分箱)

连续变量的可视化分段


前言

分段意义:

  • 符合实际情况,比如,在临床医学中,将年龄分为老、中、青三类。
  • 细致的刻画出变量与因变量的关联,比如,有些疾病的发生与年龄不是线性的关系,是曲线或者其它关系,此时将年龄变量分为n分段,有利于刻画自变量和因变量的关系。
  • 上一节的重编码过程其实也可以用于分箱过程,它可以随意分段,但是不方便,需要一个组段一个组段的一对一。
    对于没有那么复杂,没有那么精细要求的分段,SPSS提供了2个对话框界面

1.数值变量的离散化分段(分箱)

概述:

  • 希望用简单的方法进行分段时使用,比如:等距分、等量分;
  • 在可视界面下将连续变量进行分段,可直观的看到分段效果;
  • 在分段时,可以使用等间距百分位数标准差范围进行分段操作。

例:将年龄变量S3分段

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值