手把手教你使用R语言做出SCI论文中的表二(单因素分析表)(1)

在SCI论文中,我们经常可以看见一些这样的表格,大多数命名表格2,主要用来表示原因和结果的单因素分析的关系或者是分组变量的关系,如下图
在这里插入图片描述
在这里插入图片描述
这样论文中的表格数不胜数,今天我们通过一个实例数据演示告诉大家怎么一步一步把这样的表格做出来。
我们今天先来做一个这样的表格,如下图,这张表我们我们先分析一下它要表达的是什么?主要是表达单因素和结果变量之间的关系,对单因素的变量进行了分组分析,一些分类变量如性别、是否吸烟也进行了分组比较
在这里插入图片描述
我们使用SPSS自带的一个Breast cancer survival肿瘤数据来演示,首先我们把这个数据导入R,并且删除缺失值(这里只是演示怎么做表格,真正分析不能这样删除缺失值的),
library(foreign)
library(survival)
bc <- read.spss(“E:/r/Breast cancer survival agec.sav”,
use.value.labels=F, to.data.frame=T)
bc <- na.omit(bc)
在这里插入图片描述
查看一下数据的变量
head(bc)
在这里插入图片描述
age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。
假设我们想知道年龄和生存关系的影响,我们可以先对年龄进行分组
age1<-cut(bc$age,breaks = 3,labels = c(1,2,3))#平均分为3个区间,命名为1,2,3
dc<-cbind(bc,age1)#把变量加入表格
在这里插入图片描述

首先来做age和死亡结局的关系的单因素分析,本来这里有时间变量,应该做COX回归的,但是我这里为了演示数据只用广义线性方程,其实使用COX回归方程也是一样的。
在这里插入图片描述

在这里插入图片描述

先开始进行死亡结局和年龄的单因素分析,把age1带入方程
f.age <- glm(status ~ age1, family = binomial, data = dc)
summary(f.age)
在这里插入图片描述
在这里插入图片描述
计算OR和95%CI
exp(confint(f.age))
exp(coef(f.age))
在这里插入图片描述
结果已经出来了,怎么分析呢,主要是看age12,age13这里,我们原来age1分了3个区间,这里为什么只有两个呢,因为我们age12,age13都是和age11进行比较的,所以age11等于1也先建一个word表格,把年龄填上
在这里插入图片描述

下面来做一个分类变量的,ln_yesno(是否有淋巴结肿大),先把它转换为分类变量,
在这里插入图片描述
继续解析
f.ln_yesno <- glm(status ~ ln_yesno, family = binomial,data = dc)
summary(f.ln_yesno)
在这里插入图片描述
继续求OR和95%CI
exp(confint(f.ln_yesno))
exp(coef(f.ln_yesno))
在这里插入图片描述
继续填表
在这里插入图片描述
至此,连续变量和分类变量我们都做出来了,其他指标照做就可以完成此表了,看着有点麻烦,其实就是换换变量,不到20分钟就做出来了。
在这里插入图片描述

作者介绍 Toby,持牌照金融公司担任模型验证专家,国内最大医药数据心数据挖掘部门负责人!和重庆儿科医院,科院授,赛柏蓝保持慢病数据挖掘项目合作!管理过欧美日印巴西等国外药典数据库,马丁代尔数据库,FDA溶解度数据库,临床试验数据库,WHO药物预警等数据库。课程概述 此课程讲述如何运用python的sklearn快速建立机器学习模型。课程结合美国威斯康辛乳腺癌细胞临床数据,实操演练,建立癌细胞预测分类器。课程讲述十大经典机器学习算法:逻辑回归,支持向量,KNN,神经网络,随机森林,xgboost,lightGBM,catboost。这些算法模型可以应用于各个领域数据。本视频系列通俗易懂,课程针对学生和科研机构,python爱好者。本视频程系列有完整python代码,观众看后可以下载实际操作。了解癌症肿瘤基本常识,建立健康生活方式,预防癌症,减轻癌症治疗成本。课程背景 警钟长鸣!癌症离我们远吗?《我不是药神》催人泪下,笔者在此揭露真相,癌症不是小概率疾病,癌症就在身边。癌症早期发现和控制可极大延长寿命和减少治疗费用。笔者下载美国威斯康辛临床数据,运用python sklearn建立乳腺癌分类器模型,可预测正常细胞和癌细胞。我国医院重视治疗,但忽略疾病预防育。通过我多年机器学习数据挖掘,我发现疾病可防可控,通过自身努力,我们可以提前发现疾病早期症状或扼杀疾病于摇篮。希望此课程让广大医疗科研工作者认识疾病预防育重要性。  
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天桥下的卖艺者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值