本篇是风暴统计平台教程系列的第二章,将详细说明如何使用数据整理模块,因为涉及内容比较多,分为上中下三篇,此为上篇。
上一篇教程向大家详细介绍了数据导入的各点注意事项。
完成数据导入后就来到了数据整理模块。目前风暴统计平台数据整理模块共有5种功能:
本篇将重点介绍:定量变量转分类、衍生新变量。
定量变量转分类
平台提供了3类定量数据转分类数据的方法:自定义分组、按照分位数分组、转换为Z值。
在数据转换前,平台会自动提供该连续变量的简单统计学描述,为界值选择提供参考。
①自定义分组
可以自行设定界值,例如说这里我想把BMI按照评价标准18.5,24,28的界值分为4组。
输入分组临界值,中间使用英文逗号隔开!最后点击"开始分组"。
分组后,左侧数据预览框中会出现新的数据列了!包括转换后的等级变量(以custom后缀),以组中值表示的分类变量(以cus_median后缀),后者主要用于趋势性分析,计算P for trend。
这里需要说明的是,平台的分组方式是左闭右开,在这里BMI分组是(-∞,18.5),[18.5,24),[24,28),(28,+∞)。
②分位数分组
包括中位数分组、三分位数分组、四分位数分组、五分位数分组,足以满足大部分转换需要了。
不同拆分方式产生的变量名也是不同的,中位数就是median,三分位数为three,四分位数后缀为quantile,五分位数为five。如果同时使用不同的方法进行拆分,后续分析时也可以区分开,不会混淆。
③转换为标准值Z值
标准化Z分数(Z-score)转换是一种将原始数据转换为均值为0、标准差为1的标准正态分布的方法。对严重偏态数据、包含极端值数据、样本量较小的数据,不建议使用。
在一些文章中可以见到标准化数据,比如下面的per SD。
定量变量转分类
衍生新变量其实也是计算新变量,常见的加+减-乘*除/、幂指数^、平方根sqrt()等符号可以参考下方。
注意:涉及到括号也均为英文模式下的括号(),譬如说下方的运算用到了加减乘除、开方与平方,最终结果应该是age原本的数值。
平台的运行也完全没有问题。
以上就是关于数据整理模块中定量变量转分类、衍生新变量2个功能的详细教程。后面我们会继续介绍数据整理中的其他3个功能。
下篇预告:如何进行数据整理(中)
郑重声明
Zstats-AI 平台
√浙中医大统计老师郑卫军主持
√ 基于R语言软件开发
√ 免费使用,无需注册直接使用
√ 一键生成发表级图表
www.medsta.cn/software
(电脑端浏览器打开)