- 博客(8)
- 收藏
- 关注
原创 绘制ggplot风格的生存曲线
要绘制ggplot风格的生存曲线,你需要首先安装survminer包,它是一个基于ggplot2的专门用来进行生存分析可视化的R包。survminer包提供了ggsurvplot函数,它可以根据生存对象(survfit对象)来生成生存曲线,还可以添加风险表、置信区间、中位生存时间、p值等信息。你还可以使用ggplot2的其他函数和参数来调整图形的细节,如颜色、线型、字体、主题等。生存曲线是一种用来展示生存数据的图形,它可以反映不同分组或因素对生存时间的影响。
2023-12-29 18:18:52 650
原创 基于生存结局(生存分析/COX回归)的中介效应分析
① 建立观察变量OVB和中介变量MVB的回归模型(注意:这里根据mediation包的介绍,需要构建的是probit模型,而不是logist回归模型,网上有很多的代码用的logistic回归,结果自己跑的时候发现报错,我在这里陷了很久;为了方便演示,我们生成了一个协变量(Age)、一个连续型观察变量(liaOVC)、一个二分类观察变量(OVB)、一个连续型中介变量(MVC)、一个二分类中介变量(MVB)以及最后的结局变量(生存时间[time],生存结局[stats])。
2023-09-08 15:03:10 6402 18
原创 R语言 随机抽取训练集、验证集,缺失值插补 人口学特征表 ggplot2添加文字注释 分组计算统计描述 变量因子化 数据框添加新的列
本文章内包含日常学习和工作中收集的代码,接下来我也会不断的补充,有需要的小伙伴自取。本文内容收集于各网站,若有侵权,联系删除。7.人口学特征(基线表)的生成。
2022-11-16 21:44:15 1106 1
原创 R语言 as.Date()报错 Error in charToDate(x) : 字符串的格式不够标准明确
R语言是我们常用来处理数据的软件,然而在这个过程中往往会遇到很多问题,下面就是一个在随访资料的生存分析过程中遇到过的一个小问题,可也是很多人可能会遇到过的问题,因为本人寻遍了整个百度未能找到确实可行的解决办法,下面将问题和解决方案记录在下面,希望对大家有一点帮助,如果有其他问题也欢迎大家和我一起进行探讨。1.在采用Openxlsx包中的read.xlsx()函数读入数据时,设置参数read.xlsx("C:/Users/Desktop/df.xlsx",1,na.strings = "",
2022-11-16 18:28:23 5469
原创 R语言 总体均数的95%置信区间、几何均数(GMT)及其置信区间的计算
求总体均数的95%置信区间,可根据自身需要更该alpha值,计算相应的置信区间 alpha<-0.05 #置信区间 n <- length(data) #计算变量长度 mean<- mean(data) #计算均值 Z1 <- qt(1-alpha/2,n-1) #计算对应的Z值(双侧) Z2 <- qt(1-a.
2021-11-25 21:45:47 11791 3
原创 R语言 柱形图/条形图/分组条形图 绘图模板。
1.提前处理好因子(分组)变量,如计划作为x轴变量的排序,对分组变量因子化,并进行排序ad_polt<-read.csv("绘图.csv",header = T)ad_polt$分组<-factor(ad_polt$分组,levels = c("组1","组2","组3"))ad_polt$x轴变量<-factor(ad_polt$x轴变量,levels = c("lev1","lev2"<"lev3",ed)) 2.建立一个自己的图标主题,以后用到可以直接调出,修改
2021-11-01 21:47:52 3491
原创 一.统计学中常见的几种统计资料
1.计量资料:采用定量的方法测定调查对象的结局指标获得数据称为计量资料。如高血压患者的血压监测数据(120mmHg,125mmHg,126mmHg,127mmHg);糖尿病患者的血糖测量值(7.1mmol/L,7.2mmol/L,7.3mmol/L...)等(1)连续型计量资料:可连续取值的资料,常含小数点。如升高,体重,血糖值,学生加权成绩等(2)离散型计数资料:只取整数的资料,常不含小数点。如班级人数,心率次数等2.计数资料:将调查对象按照一定的性质进行分组...
2021-10-22 21:31:02 3879
全国2015年-2022年慢性病发病、死亡与大气污染及气象数据(分布滞后非线性模型分析)
2024-04-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人