1. 前言
怎么快速绘制绘制临床论文中的基线特征表1
?
需要用到tableone
包。
tableone
包是用来创建“表1”
(也就是生物医学研究论文中常见的的患者基线特征表),可以在一张表中汇总连续变量和分类变量。
分类变量表示为计数和或百分比,连续变量呈正态分布表示为均值±标准差,呈非正态分布表示为中位数和四分位数。
2. 下载和加载R包
install.packages("tableone") # 安装包
library(tableone) # 加载包
3. 加载数据集
library(survival) # 使用survival包的colon数据
data(colon) # 加载数据集
数据集介绍双击这里。
4. 单组汇总
CreateTableOne(data = colon) # 汇总摘要整个数据集
从上面可以看出,数据集中共有1858
例患者,但由于没有将部分变量转化为因子,所以分类变量显示的是均值+标准差。
5. 分类变量转换
大多数分类变量是用数字编码的,常表示为0、1和2
等,因此我们要么在数据集中将其转换为因子,要么是使用factorVars
参数进行转换。
通过vars
参数指定哪些变量是需要汇总的变量,排除无关变量。
dput(names(colon)) # 输出colon数据集变量名称
输出:
c("id", "study", "rx", "sex", "age", "obstruct", "perfor", "adhere",
"nodes", "status", "differ", "extent", "surg", "node4", "time", "etype")
从数据集介绍中,我们知道 "rx", "sex","obstruct", "perfor", "adhere", "status","differ", "extent", "surg", "node4","etype"
是分类变量。
5.1 指定需要汇总的变量
myVars <- c("rx", "sex", "age", "obstruct", "perfor", "adhere",
"nodes", "status", "differ", "extent", "surg", "node4", "time",
"etype")
<