在数据整理及分析中,我们经常遇到需要根据现有变量生成新变量的情况,比如将连续型的年龄划分为年龄段,将BMI的具体值转换为“标准”、“超重”等分组,提取地址变量中的某个字段,提取时间变量中的年月日等等。
在常用的一些编程统计分析软件中,我们需要记住一些函数才能够实现。而在JMP中,这些需求都可以通过清晰直观的“公式编辑器”点击操作实现,某些甚至可以一键生成。
今天这篇文章我们将介绍几个平时分析中最常用的情境,帮助大家直观感受JMP生成新变量的方便与快捷。
为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第7期。
01 如何利用"公式编辑器”生成新变量?
我们首先选取JMP自带样本数据库中的Diabetes数据,如图1。
图1 JMP样本库自带示例数据Diabetes
插入新变量
假设我们要根据BMI产生分类变量。
首先,创建一个新变量用来指示分组。这里有两种方式,第一种是在任何一个变量顶部变量名处单击右键弹出菜单选择插入列,如图2。