自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(304)
  • 资源 (20)
  • 收藏
  • 关注

转载 nhanes数据行ROC曲线并BOOT重抽样获取可信区间

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。既往咱们已经多篇文章对nhanes数据进行了分析介绍,粉丝私信问:如何行ROC分析,并重抽样获取可信区间。地址为:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx。

2024-05-20 09:15:53 12

原创 R语言使用 ggscidca包优雅的绘制支持向量机决策曲线

数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。进行分析前还需对数据进行预处理,如果你是多分类的,并且数据差异大,可以使用分层抽样,尽量是数据匹配一下,方法详见我既往文章《R语言两种方法实现随机分层抽样》,我这里是二分类,我就不弄了。最后向大家汇报一下,多模型的决策曲线和混合模型的决策曲线已经写好,下周上传,到时我再出个视频介绍一下。定义一个标准化的小程序。

2024-05-17 09:23:11 248

原创 R语言手把手教你进行支持向量机分析

数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。公众号回复:体检数据,可以获得数据。上图给出了一些模型的基本参数,默认情况下,gamma为预测变量个数的倒数,cost为1。进行分析前还需对数据进行预处理,如果你是多分类的,并且数据差异大,可以使用分层抽样,尽量是数据匹配一下,方法详见我既往文章《R语言两种方法实现随机分层抽样》,我这里是二分类,我就不弄了。

2024-05-14 09:07:46 834

原创 代码+视频,R言语处理数据中的缺失值

在SCI论文中,我们不可避免和缺失数据打交道,特别是在回顾性研究,对于缺失的协变量(就是混杂因素),我们可以使用插补补齐数据,但是对于结局变量和原因变量的缺失,我们不能这么做。部分人的做法是直接删除掉这部分的数据(如SEER数据库),有些高分SCI杂志的审稿人会问你缺失数据的情况和你是怎么处理的,如果我们能附上一个缺失数据和未缺失数据比较的表格,可以起到一表抵千言万语的作用,如下图。今天咱们视频演示一下如何R语言做出上面的表格。R言语处理数据中的缺失值。

2024-05-11 10:18:09 282

原创 R语言两种方法实现随机分层抽样

其实用起来非常简单哈,data就是你的数据,strataname就是你分层的变量名字,我们这里当然是SEX性别啦,size就是你抽取的数量,method是抽取的方法,有不替换的简单随机抽样(srswr)、替换的简单随意抽样(srswr)、泊松抽样(Poisson)、系统抽样(systematic sampling);这是个体检相关的数据,公众号回复:体检数据,可以获得这个数据。如果要提取数据,需要使用ID_unit这个变量,这是数据的标识,咱们通常会把分层抽样的数据用来建模,其余的数据用来验证。

2024-05-10 17:39:35 400

原创 scitb5函数2.1版本(交互效应函数P for interaction)发布----用于一键生成交互效应表、森林图

数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值。加下来说一个包含的问题,在既往函数中,我要求协变量COV是要包含分层变量,不然就会报错,但也有些粉丝说这样有时候不够灵活,新版本中这个包含规则也是可以关掉的,我重新设置一下协变量h额分层。生成结果,这里的Y是连续变量,所以是线性回归。导入我们的早产数据和函数。

2024-05-08 11:51:57 602

原创 生存分析亚组交互函数scitb5.coxph 1.6尝鲜版(P for interaction)发布----用于一键生成交互效应表、森林图

然后一句话代码就可以生成表格,data是你的数据,必须是数据框形式,x是你研究的目标变量,y是你的结局变量,time是你的时间变量,Interaction是你的分层变量,这个必须是分类变量并转成因子,cov是你的协变量,family="cox"这个是固定的。Cox回归也是可以一键生成森林图的,既往森林图黑色我觉得有点单调,改成蓝色了。加下来说一个包含的问题,在既往函数中,我要求协变量COV是要包含分层变量,不然就会报错,但也有些粉丝说这样有时候不够灵活,新版本中这个包含规则也是可以关掉的,比如以下情况。

2024-05-07 09:04:27 614

原创 代码+视频,R语言绘制生存分析模型的时间依赖(相关)性roc曲线和时间依赖(相关)性cindex曲线

ROC曲线分析是用于评估一个因素预测能力的手段,是可以用于连续型变量分组的方法。在生存分析中,疾病状态和因素取值均会随时间发生变化。而标准的ROC曲线分析将个体的疾病状态和因素取值视作固定值,未将时间因素考虑在分析之中。在这种情况下,使用时间依赖性ROC无疑是更好的选择。R语言绘制生存分析模型的时间依赖(相关)性roc曲线和时间依赖(相关)性cindex曲线。今天咱们视频来演示一下时间依赖ROC曲线绘制。

2024-04-28 10:11:31 424

原创 R语言使用sjPlot包优雅绘制回归模型的交互效应图

这是一个有关于老年人护理的数据,我介绍一下等会我要用到的变量,neg_c_7:7个项目的负面影响,c12hour:每周平均护理时数,BARTHTOT:总分 BARTHEL INDEX,c161sex :照顾者的性别,得出不同性别,在不同barthtot 分数段中,护理时间和负面影响的关系,我们可以看到barthtot 分数70分这段,护理时间越长,负面影响越高,男女都是一样,儿30分这段随着护理时间延长没有什么变化。除了2项交互,terms- 参数还可以接受三个模型项,因此您还可以计算三向交互的边际效应。

2024-04-25 09:24:29 539

原创 代码+视频,R语言对数据进行多重插补后回归分析

我们在临床做回顾性研究分析中经常要面对数据缺失的问题,如果数据缺失量大就会对我们的研究结果产生影响,近年来,对数据进行多重插补广泛应用于SCI论文中。我们在之前的文章中已经演示了使用SPSS对数据进行多重插补并分析。今天,我们通过视频演示使用R语言的Mice包来演示多重插补并对数据进行分析。R语言对数据插补并进行分析。

2024-04-19 09:36:35 460

原创 R语言使用installr包对R包进行整体迁移

今天分享一个R语言的实用小技巧,如果咱们重新安装了电脑(我重装了电脑)或者因为需要卸载旧版本的R软件,安装新版本的R,那么必然会造成R包的库缺失,需要重新下载,有些还不是官方的R包,下载非常麻烦。from就是我旧版本的R软件的位置,to就是我新版本的R软件的位置。这个R包的迁移的函数是copy.packages.between.libraries函数,有点长,大概的格式就是下面这样的。咱们可以使用installr包把旧版本的R的R包库转移到新的版本,非常简单。我觉得还是挺简单使用的,本期结束啦。

2024-04-16 09:02:31 536

原创 18篇文章带你深入浅出了解亚组交互作用(p for Interaction)及可视化分析

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,进行可视化后可以清晰的表明变量之间的关系。2. SPSS联合Excel进行logistic回归亚组交互效应(交互作用)的可视化分析,不用代码操作也能做出交互效应图。编写NHANES亚组交互函数,可以一键生存亚组分析交互效应表并绘制森林图,目前已经更新到1.7版本。5.使用visreg包快速进行R语言logistic回归交互项的可视化分析。

2024-04-14 10:48:07 2558

原创 代码+视频,R语言手动绘制连续线条的校准曲线(Calibration curve)(3)

校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距。我们既往已经通过多篇文章介绍了等分的校准曲线绘制,今天来视频介绍一下上图这种连续的,线条样的校准曲线绘制。

2024-04-12 10:14:33 275

转载 两种方法手把手教你R语言多分类变量亚组相加交互模型分析

不少粉丝问如何进行多分类的相加交互模型分析,今天咱们来演示一下,继续使用咱们的不孕症数据(公众号回复:不孕症,可以获得这个数据)Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。这样fage就是年龄进行等分后的变量,是个3等分的变量,spontaneous自然流产次数也是个3等分的变量,等下咱们就是研究这两个变量的交互。有文献表明,单单只用乘法交互效应低估了疾病协同的危险性,从而低估了发病率。

2024-04-09 09:11:35 501

原创 代码+视频,手动绘制logistic回归预测模型校准曲线(Calibration curve)(2)

我们既往文章《手动绘制logistic回归预测模型校准曲线》已经进行了手动绘制logistic回归预测模型校准曲线,今天继续视频来介绍外部数据的校准曲线验证和分类数据的校准曲线。一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距。R语言手动绘制logistic回归预测模型校准曲线(Calibration curve)(2)校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。

2024-04-07 12:47:48 362

原创 R语言使用 ggscidca包优雅的绘制竞争风险模型决策曲线

对于不同的结果, ggscidca包的结果是根据决策曲线发明者大佬AndrewVickers博士提供的stdca.R函数生成结果的,stdca.R函数其实是可以进行竞争风险模型分析的,但是stdca.R单独生成结果有点小问题(其实不算问题,应该认知不同),我稍微修改了一点,让它更易于分析竞争风险模型(核心代码没有动),我反复比对了stdca.R的代码原理和数据生成的结果,认为没有错,那只能是dcurves包错了。这步不做就没法分析,你原先就是0,1,2形式的不用改,直接下一步就行。

2024-04-03 09:09:16 958

原创 分享一个nhanes数据报错的解决方案

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。今天分享一个小的NANES报错小方案,目前有不少粉丝私信我是说:使用survey包的时候出现如下图错误:stratum has only one PSU at stage 1。这个报错是因为survey进行权重抽样计算的时候PSU分配到单一的变量所致,咱们导入包的时候可以对它进行一下设置。

2024-03-31 11:01:53 379

原创 代码+视频,手动绘制logistic回归预测模型校准曲线(Calibration curve)(1)

今天我们来视频演示第一种,手动绘制的好处在于加深你对绘图的理解,而且能个性化的进一步处理图形。第一种绘图本质就是我们的折线图,一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距.R语言手动绘制logistic回归预测模型校准曲线(Calibration curve)(1)校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。另外一种是calibration函数重抽样绘制连续的校准图。

2024-03-30 11:38:30 500

原创 R语言使用dietaryindex包计算NHANES数据多种营养指数(2)

健康饮食指数 (HEI) 是评估一组食物是否符合美国人膳食指南 (DGA) 的指标。Dietindex包提供用户友好的简化方法,将饮食摄入数据标准化为基于指数的饮食模式,从而能够评估流行病学和临床研究中对这些模式的遵守情况,从而促进精准营养。该软件包可以计算以下饮食模式指数:• 2020 年健康饮食指数(HEI2020 和 HEI-Toddlers-2020)• 2015 年健康饮食指数 (HEI2015)• 另类健康饮食指数(AHEI)• 控制高血压指数 (DASH) 的饮食方法。

2024-03-28 08:42:14 1584 2

原创 代码+视频,R语言logistic回归交互项(交互作用)的可视化分析

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,不仅如此,交互作用还可以使用来进行数据挖掘。在既往文章中,我们已经介绍了怎么使用R语言可视化visreg包对交互作用进行可视化分析(见下图)使用visreg包后我们对图形的细节掌控力不够,今天我们视频介绍使用重新绘制手动图形,这在SCI论文中非常实用,几乎可以做出所有的交互可视化,也有利于我们了解制图原理。

2024-03-22 10:00:48 1208

原创 R语言使用 ggscidca包优雅的绘制随机森林决策曲线

DCA(Decision Curve Analysis)临床决策曲线是一种用于评价诊断模型诊断准确性的方法,在2006年由AndrewVickers博士创建,我们通常判断一个疾病喜欢使用ROC曲线的AUC值来判定模型的准确性,但ROC曲线通常是通过特异度和敏感度来评价,实际临床中我们还应该考虑,假阳性和假阴性对病人带来的影响,因此在DCA曲线中引入了阈概率和净获益的概念。应粉丝的要求在,在新版本ggscidca包添加了虚线功能,你可以在阈值的两点添加虚线,加上线条也是可以的,线条还可以改颜色,线型和大小。

2024-03-20 09:09:31 412

原创 代码+视频,R语言使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间

BOOT重抽样在我们统计中处理数据还是很有用的,本期我们来介绍一下怎么使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间,这也是一个粉丝向我问的问题,我觉得蛮有典型性和实用性的,因此就拿出来讲讲。bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大于500次以上)次,然后得到N个统计结果,然后进行区间分析,得到最终结果。

2024-03-15 08:28:57 577

原创 R语言tidycmprsk包分析竞争风险模型

既往我们在文章《手把手教你使用R语言做竞争风险模型并绘制列线图》和《一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线》已经介绍了使用cmprsk包绘制和QHScrnomo包进行分析,今天咱们来介绍一下tidycmprsk包,它也是基于cmprsk包进行分析,但是功能更多,绘制图形更加精美。接下来咱们来演示多因素分析,如果你不指定结局的话,会默认的把第一个结局当成存活,最后一个结局当成竞争风险指标,就是咱们常见的0,1,2形式。咱们也可以进一步指定,这样清楚一点。

2024-03-12 09:02:09 686

原创 NHANES数据(复杂调查数据)亚组交互函数1.7(P for interaction)发布-纠正了目前的一个问题

大家好,有粉丝私信我说NHANES数据(复杂调查数据)亚组交互函数1.版本交互函数有点问题,我查看了一下,有个代码调用失效了。就是下面这个,本来我是这样调用数据的。应该是由于R版本或者survy包升级后导致这个调用代码失效了,导致了调查数据没有加权,给您带来不便敬请见谅。

2024-03-08 11:42:44 405

原创 首发ggscidca包,来来来---绘制个不一样的决策曲线,让你审稿人眼前一亮

上图这个图形我考虑过ggplot2包的多个函数,如geom_bar,geom_raster,geom_col等,其中geom_col本来最满意,可以绘制出渐变风格的区域条形图,但是geom_col不好嵌入字体(应该是我技术水平还不够,以后水平高了再重新写一下),后面刚好看到其他博主使用geom_rect来复现这个图片,复现得还挺不错的,后面就参考了一部分他的方法,geom_rect主要的有点是灵活多变,可以应对不同的情况。生成图形后,如果你想对这个条形图进行调整,也是可以的,要关注函数生成的2行信息。

2024-03-05 09:08:08 1036

原创 代码+视频R语言使用BOOT重抽样获取回归方程系数95%可信区间

bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大于500次以上)次,然后得到N个统计结果,然后进行区间分析,得到最终结果。bootstrap自采样对于小样本数据计算效果较好,也可以在线性方程中通过bootstrap自采样计算并绘制出可信区间。本期视频介绍R语言使用BOOT重抽样获取回归方程系数95%可信区间。

2024-03-01 09:34:02 212

原创 R语言使用dietaryindex包计算NHANES数据多种健康饮食指数 (HEI等)(1)

FPED 人口文件是指 WWEIA 中食品的食品模式等效文件,可以在这个网址下载:https://www.ars.usda.gov/northeast-area/beltsville-md-bhnrc/beltsville-human-nutrition-research-center/food-surveys-research-group/docs/fped-databases/最后的DEMO文件是指人口统计变量和样本权重中的DEMO文件,在下面这个地址可以下载,选年份和上面是一样的。

2024-02-28 16:17:56 3198 4

原创 代码+视频手把手教你R语言基于pROC包绘制多条ROC曲线

可以做ROC曲线的软件很多,如SPSS,R语言,Stata, SAS等等,既往我们已经介绍了使用SPSS制作ROC曲线,今天我们来视频介绍怎么使用R语言绘制多条ROC曲线,继续使用我们的肺炎数据(公众号回复:肺炎,可以获得数据)ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。ROC曲线主要应用于二分类结局,比如是否死亡,疾病诊断,肿瘤复发等等,可以用于自变量为连续变量的截点判定。

2024-02-23 08:59:27 928

原创 ggrcs包3.8版本发布—增加了密度曲线,X轴截断和字体设定

本次主要增加了3个内容,1是增加了单组的密度曲线图,2是增加了X轴的截断和限制功能3是增加了字体的设置功能。这个图目前只能做单组,因为双组的话rms包会把两个数据重组分布,然后经过从新缩放,双组的话两个密度曲线会叠加一起,这个涉及到了绘图的核心逻辑,目前没什么好办法。绘制成这个样子主要是因为数据不是正态分布,分布范围太广了,除了改成单纯RCS曲线,咱们可以改成密度曲线。除了字体,字的大小也可以改的,这里分为刻度的字体和标签的字体都可以调整。下面我来演示一下,先导入数据和R包,直接使用R包自带的吸烟数据。

2024-02-19 09:05:34 702 10

原创 迎新年,送新手福利, 送2篇nhanes文章全套复现代码

这篇文章反映的是一些身体指标和活动代谢的关系,这篇文章虽然作者给出了复盘文章的全套代码,但是nhanesaccel包已经损害不能安装使用了,我重新修复了nhanesaccel包的代码,使得文章能全盘复制,我还做了很多代码的注释,可以更好的分析代码,了解思路,让您事半功倍。每篇文章都超过600行代码,从数据下载到数据清洗,再到数据分析,绘制表格。本次赠送2篇关于nhanes数据的已经发表的文章的全套代码,可以手把手复现文章的表格和结论,对刚进行nhanes数据分析的新手应该会特别有帮助,老手可以跳过。

2024-02-16 10:33:18 663

原创 代码+视频基于R语言进行K折交叉验证

可以看成是留一交叉验证的简化版,是将原始数据据随机平均分为k个子集(通常5-10个),每个子集做测试集的同时,其余k-1个子集合并作为训练 ,进行 k 次训练,取各评价指标(灵敏度、特异度、AUC等)的平均值。:是我们临床论文中最常使用到的,从数据中随机选择中随机选择70%点的数据作为训练集建立模型,30%的数据当做外部数据来验证模型的预测能力。10折交叉验证是指将原始数据集随机划分为样本数近乎相等的10个子集,轮流将其中的9个合并作为训练集,其余1个作为测试试集。基于R语言进行K折交叉验证。

2024-02-14 11:07:07 1111

原创 代码+视频一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

我们在既往文章《手把手教你使用R语言做竞争风险模型并绘制列线图》中已经介绍了cmprsk包建立竞争风险模型和绘制列线图,但是cmprsk包功能还是相对简单一点,而且制作列线图的时候还需要对数据进行加权,对新手不怎么友好,许多人做不出来。今天我们来介绍一下QHScrnomo包,QHScrnomo是在cmprsk包的基础上将功能呢继续完善,简化流程,可以做出竞争风险模型建模-列线图-校准曲线-K折验证-外部验证-决策曲线等诸多功能,总有一款适合你。好了,废话不多说,立即开始。为竞争风险模型构建列线图。

2024-02-06 09:21:34 398

原创 R语言阈值效应函数cut.tab2.0版发布(支持线性回归、逻辑回归、cox回归,自定义拐点)

在既往我们在文章《cox回归RCS阈值效应函数cut.tab1.3发布》发布了自写的阈值效应函数1.3版本,反应还不错,不过1.3版本只能支持cox回归,本次发布了新的2.0版本,支持线性回归、逻辑回归、cox回归, 还有自定义拐点功能。泊松回归还不支持,目前正在开发中。接下来使用cuttab函数生成拐点数据,这里注意一下,新版本和旧版本不同的是这里是cph生成生存模型,cuttab重点是没有点这个符号的。接下来咱们还要建一个新的fit1和原来的fit稍微有点不一样的,这个是没有rcs函数的。

2024-02-05 11:28:24 1845 3

原创 聊聊Nhanes数据怎么做中介效应分析

研究的是银屑病和冠心病发病的中介因素,咱们来看下统计学部分,这篇文章介绍缺失超过30%的变量被删除,以后咱们也可以这样做。这个研究是探索挥发性有机物的个体代谢产物和组合代谢产物之间的关系尿液中的(mVOCs),代表VOCs的内部暴露水平,具有骨密度(BMD),骨质疏松症(OP)和骨折以及潜在的介质。最后来介绍一篇7分的文献,为什么放在最后介绍呢,因为它是个统计专业的杂志,应该可靠性很强,而且它还附带了代码。看到了把,使用的是mediation包,这是个常用的中介分析的包,我已经有多篇文章进行介绍了。

2024-02-02 09:06:28 1016 3

原创 代码+视频,PM3包进行3组倾向评分匹配并绘制smd图

在观察研究中,由于种种原因,数据偏差(bias)和混杂变量(confounding variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。我们的回顾性研究都是过去的数据,很难像RCT一样进行严格的筛选出两组患者基线相近的基础资料,但我们可以通过倾向评分匹配把回归性的数据进行筛选,把基线资料相近的患者进行匹配,得到近似RCT的效果。目前,本人写的第二个R包pm3包的1.8版本已经正式在CRAN上线,用于3组倾向评分匹配,只能3组不能多也不能少。

2024-01-29 09:54:25 465

原创 代码+视频,R语言forestploter包优雅的绘制孟德尔随机化研究森林图

我们今天来做个上图这样的森林图,使用的是《R语言复现一篇6分的孟德尔随机化文章》的数据,这篇文章作者直接提供了数据,所以我就直接拿来用了。作者分析了很多精神病和骨密度的结果,这里我就取精神分裂症和骨密度结果来分析。在既往文章中,我们对孟德尔随机化研究做了一个简单的介绍。我们可以发现,使用TwoSampleMR包做出来的森林图并不是很美观。今天我们使用R语言forestploter包优雅的绘制孟德尔随机化研究森林图。使用TwoSampleMR包做出来的森林图是这样的。而很多SCI文章中的森林图是这样的。

2024-01-26 08:58:37 1230

原创 R语言VRPM包绘制多种模型的彩色列线图

列线图,又称诺莫图(Nomogram),它是建立在回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概率。咱们既往已经多篇文章介绍绘制列线图,今天咱们来介绍一下VRPM包绘制彩色列线图,这个包可以绘制多个模型的列线图,咱们一一来介绍。这是很简单的数据,admit是个分类的结局变量,其他的是协变量,(公众号回复:列线图数据,可以获得这个数据。数据中的rfst是生存时间,cens是结局变量,其他的是协变量。

2024-01-24 08:54:11 851

原创 代码+视频R语言绘制逆概率加权后的基线表

基于 PS (倾向评分)的逆概率加权(IPTW )法首先由Rosenbaum作为一种以模型为基础的直接标准化法提出,属于边际结构模型。简单来说,就是把许多协变量和混杂因素打包成一个概率并进行加权,这样的话,我只用计算它的权重就可以了,方便了许多。那么,如何将多个协变量的影响用一个倾向评分值来表示呢?根据 Rosen-baum 和 Rubin 的定义:倾向评分值为在给定一组协变量(X i )条件下,研究对象 i(i =1,2,…N)被分配到某处理组或接受某暴露因素(Z i =1)的条件概率。

2024-01-22 09:16:52 694

原创 回顾2023年总结和2024年计划

2.不少粉丝说ggrcs包不能做大于10万的数据,还有一些国外的老外也发邮件来问这个问题,其实这是rms包的限制,随着我对rms包理解加深,本人最近已经改良算法成功,在未来新版的新版ggrcs包将支持超过10万数据的绘图,为seer数据等大型数据提供支持。如果你确实需要帮助,问的时候要提供详细的资料,比如完全的代码、数据结构,报错代码,你做了什么尝试都要说的,你就发个报错代码,其他都没有,除非很简单,不然我也看不出来的。

2024-01-19 10:03:34 969

原创 代码+视频R语言3组以上倾向评分逆概率加权(IPTW)

PS为观察单位的倾向评分值。后台有粉丝问,怎么使用R进行3组以上的倾向评分逆概率加权(IPTW),看了上面内容我们就明白,只要知道每组数据的倾向评分(也就是概率),根据公式转成权重数就可以了,和做两组的步骤基本一样,今日咱们来演示一下语言3组以上倾向评分逆概率加权(IPTW)。综上所述:倾向评分加权法首先将多个主要混杂变量的信息综合为一个变量倾向评分 ,然后将倾向评分作为需要平衡的混杂因素 ,通过标准化法的原理加权,使各对比组中倾向评分分布一致 ,则达到使各混杂因素在各比较组分布一致的目的。

2024-01-18 09:14:43 586

早产数据,可以用于文章中的统计学方法研究

早产数据,可以用于文章中的统计学方法研究

2023-02-21

2000年美国总统全国选举数据,可用于数据分析

2000年美国总统全国选举数据,可用于数据分析

2023-02-21

美国芝加哥1987年至 2000年大气污染与死亡数据2(第二部分),可用于时间相关序列数据分析

美国芝加哥1987年至 2000年大气污染与死亡数据2(第二部分),可用于时间相关序列数据分析

2023-02-17

美国芝加哥1987年至 2000年大气污染与死亡数据,可用于数据分析

美国芝加哥1987年至 2000年大气污染与死亡数据,可用于数据分析

2023-02-17

患者的体检数据2(第二部分),可以用于进行数据分析

患者的体检数据2(第二部分),可以用于进行数据分析

2023-02-16

体检数据,可用于进行文章中的数据分析

体检数据,可用于进行文章中的数据分析

2023-02-16

原发性胆道胆管炎数据,可以用来做数据分析

原发性胆道胆管炎数据,可以用来做数据分析

2022-12-10

nhanes插补数据,可以用于nhanes插补数据的分析

nhanes插补数据,可以用于nhanes插补数据的分析

2022-12-09

森林图数据,可以用于绘制森林图

森林图数据,可以用于绘制文章中的森林图

2022-11-10

纽约房价数据,可用于数据分析

纽约房价数据,可用于数据分析

2022-11-03

自己提取的nhanes数据库

自己提取的nhanes数据库,可用于数据分析

2022-11-03

利用广义可加模型对分类数据进行曲线拟合代码

利用广义可加模型对分类数据进行曲线拟合代码

2022-07-12

一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

2022-06-20

利用重抽样获取广义可加模型曲线的可信区间重抽样代码

利用sample函数重抽样获取广义可加模型函数曲线的可信区间,这可是一个非常实用的技能,假设我们想了解某连续变量和结果之间的关系,可以使用mgcv包获得两者之间的曲线关系,但是mgcv不能做出95%可信区间,我们可以通过重抽样获取其可信区间。这可是很多的付费课程,付费软件的功能哦。

2022-05-18

SPSS中介效应分析插件(Process和mediate插件)

包含Process和mediate插件

2022-03-09

SPSS主成分分析绘图操作

SPSS主成分分析绘图操作

2022-01-26

stata临床决策曲线包.rar

stata临床决策曲线包,包含有dca包和stdca包

2021-05-31

eicu数据库考试答案.rar

eicu数据库考试答案,我自己写的

2021-01-23

nomocox.zip

stata制作列线图的包(package)

2021-01-20

nomolog.zip

stata制作列线图的包(package)

2021-01-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除