自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 分布滞后非线性模型

分布滞后非线性模型的运用

2024-04-01 13:33:27 772

原创 绘制ggplot风格的生存曲线

要绘制ggplot风格的生存曲线,你需要首先安装survminer包,它是一个基于ggplot2的专门用来进行生存分析可视化的R包。survminer包提供了ggsurvplot函数,它可以根据生存对象(survfit对象)来生成生存曲线,还可以添加风险表、置信区间、中位生存时间、p值等信息。你还可以使用ggplot2的其他函数和参数来调整图形的细节,如颜色、线型、字体、主题等。生存曲线是一种用来展示生存数据的图形,它可以反映不同分组或因素对生存时间的影响。

2023-12-29 18:18:52 650

原创 基于生存结局(生存分析/COX回归)的中介效应分析

① 建立观察变量OVB和中介变量MVB的回归模型(注意:这里根据mediation包的介绍,需要构建的是probit模型,而不是logist回归模型,网上有很多的代码用的logistic回归,结果自己跑的时候发现报错,我在这里陷了很久;为了方便演示,我们生成了一个协变量(Age)、一个连续型观察变量(liaOVC)、一个二分类观察变量(OVB)、一个连续型中介变量(MVC)、一个二分类中介变量(MVB)以及最后的结局变量(生存时间[time],生存结局[stats])。

2023-09-08 15:03:10 6402 18

原创 R语言 随机抽取训练集、验证集,缺失值插补 人口学特征表 ggplot2添加文字注释 分组计算统计描述 变量因子化 数据框添加新的列

本文章内包含日常学习和工作中收集的代码,接下来我也会不断的补充,有需要的小伙伴自取。本文内容收集于各网站,若有侵权,联系删除。7.人口学特征(基线表)的生成。

2022-11-16 21:44:15 1106 1

原创 R语言 as.Date()报错 Error in charToDate(x) : 字符串的格式不够标准明确

R语言是我们常用来处理数据的软件,然而在这个过程中往往会遇到很多问题,下面就是一个在随访资料的生存分析过程中遇到过的一个小问题,可也是很多人可能会遇到过的问题,因为本人寻遍了整个百度未能找到确实可行的解决办法,下面将问题和解决方案记录在下面,希望对大家有一点帮助,如果有其他问题也欢迎大家和我一起进行探讨。1.在采用Openxlsx包中的read.xlsx()函数读入数据时,设置参数read.xlsx("C:/Users/Desktop/df.xlsx",1,na.strings = "",

2022-11-16 18:28:23 5469

原创 R语言 总体均数的95%置信区间、几何均数(GMT)及其置信区间的计算

求总体均数的95%置信区间,可根据自身需要更该alpha值,计算相应的置信区间 alpha<-0.05 #置信区间 n <- length(data) #计算变量长度 mean<- mean(data) #计算均值 Z1 <- qt(1-alpha/2,n-1) #计算对应的Z值(双侧) Z2 <- qt(1-a.

2021-11-25 21:45:47 11791 3

原创 R语言 柱形图/条形图/分组条形图 绘图模板。

1.提前处理好因子(分组)变量,如计划作为x轴变量的排序,对分组变量因子化,并进行排序ad_polt<-read.csv("绘图.csv",header = T)ad_polt$分组<-factor(ad_polt$分组,levels = c("组1","组2","组3"))ad_polt$x轴变量<-factor(ad_polt$x轴变量,levels = c("lev1","lev2"<"lev3",ed)) 2.建立一个自己的图标主题,以后用到可以直接调出,修改

2021-11-01 21:47:52 3491

原创 一.统计学中常见的几种统计资料

1.计量资料:采用定量的方法测定调查对象的结局指标获得数据称为计量资料。如高血压患者的血压监测数据(120mmHg,125mmHg,126mmHg,127mmHg);糖尿病患者的血糖测量值(7.1mmol/L,7.2mmol/L,7.3mmol/L...)等(1)连续型计量资料:可连续取值的资料,常含小数点。如升高,体重,血糖值,学生加权成绩等(2)离散型计数资料:只取整数的资料,常不含小数点。如班级人数,心率次数等2.计数资料:将调查对象按照一定的性质进行分组...

2021-10-22 21:31:02 3879

全国2015年-2022年慢性病发病、死亡与大气污染及气象数据(分布滞后非线性模型分析)

本数据库共包括一下4个数据集 1. 2015年-2016年全国慢性病(高血压 高脂血症 糖尿病 吸烟 肥胖 合并疾病 冠心病 心房颤动 慢性心力衰竭 心脏瓣膜病 脑血管疾病 外周动脉疾病 主动脉瘤 COPD 慢性肾病 贫血 消化性溃疡 甲状腺功能异常 恶性肿瘤)的发病和死亡数据 2. 2015年-2016年全国大气污染数据(PM2.5 PM10 So2 No2 Co O3) 3.2015年-2016年全国大气污染数据(气温(℃) 相对湿度(%)气压(hpa) 气温(℃) 相对湿度(%) 气压(hpa) ) 以上四个数据库均完成匹配,其中发病率数据44.9万条,死亡数据1万余条,均已完成匹配。 注:该数据可作为环境流行病学分析示例数据,进行分布滞后非线性模型分析,仅包含所有变量的部分数据,完整数据联系授权获取。

2024-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除