自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(318)
  • 资源 (9)
  • 收藏
  • 关注

原创 R语言优雅的进行广义可加模型泊松回归分析

我解释一下变量名:dyad是ID标识的意思,background:表明来自哪个国家,months:月份,只有10,11,12共3个月,gesture手势的类型,count:手势的计数,这个是 结局变量。既往已经有文章《R语言进行泊松回归》初步的介绍了泊松回归,本期介绍下如何使用tidygam包来优雅的进行泊松回归,tidygam包主要是通过mgcv包来进行分析,通过对tidygam包对mgcv包的数据转换后,上手难度大大降低,可以轻松优雅的进行泊松回归分析。绘图,一定要用series标明绘制哪个变量。

2024-07-24 16:19:30 413

原创 R语言优雅的把数据基线表(表一)导出到word

数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值。假设咱们想race为研究目标,因为它是分类变量,咱们最好把它转成因子,因为scitb包有一定对数据类型的判定能力,如果你的分类变量类别大于5个,而你不转成因子的话,它可能自动判定为连续变量,处理方式不一样的,所以这里最好自己设定一下。

2024-07-17 19:02:41 564

原创 新版亚组交互效应函数(P for interaction)newscitb5 1.3版本发布--用于一键生成交互效应表

什么是亚组,通常就是特殊类型人群,比如男女,种族等,就是说你的数据放入特殊人群中结果还可靠吗?在第二个表格进行了另外一种方式对数据的处理,等于是把数据分层了8个亚组,女性Q1组,女性Q2组,女性Q3组,女性Q4组,男性Q1组,男性Q2组,男性Q3组,男性Q4组,以女性女性Q1组为参考,其他数据和它进行了参考。生成数据,data就是你的数据,x就是你研究的变量,y就是你的结局变量,结局变量必须是分类变量,Interaction就是你的分层变量,cov就是你的协变量,family="glm"这里是固定的。

2024-07-09 09:39:51 942

原创 ggrcs包4.0版本发布—重新对密度图宽度进行了设计

目前本人写的ggrcs包新的4.0版本已经在CRAN上线,目前支持逻辑回归(logistic回归)、cox回归和多元线性回归。第二个就是线性回归中因为宽度问题导致绘图不美观的问题,使用我的臭氧数据来演示这个情况(公众号回复:臭氧数据,可以获得这个数据)第一个是有柱子在负轴的问题,既往偶有柱子在负轴的问题,我用一个粉丝的数据来演示一下,代码不解释了,可以看我既往的文章。绘制出的这个图不怎么美观是因为宽度没有控制好,新版本对宽度重新进行自动计算后,还是原来的代码。需要的可以使用代码安装。

2024-07-05 09:12:11 380

原创 R语言fastshap包进行支持向量机shap可视化分析

数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。生成以后就是用fastshap包的explain函数来进行计算shap就可以了,使用的是蒙特卡罗算法。使用fastshap包可以做很多模型的shap,做shap可视化的关键就是要定义一个生成预测值概率的函数,接下来咱们要生成一个支持向量机的模型,这里我就直接上代码了,想具体了解的直接可以看上面的文章。

2024-07-03 09:10:49 401

原创 推荐一本RMS包作者写的我正在追读的书《Regression Modeling Strategies》

文章表明一般来说节点数再3——5之间就可以了,节点为4通常可以很好的拟合了,样本量小(n100)的时候可以选5,也可以使用AIC的似然比来决定K值。写这本书的就是RMS包的作者,这是他早些年写的书,我们可以结合他写的书来加深对RMS包的理解,我个人觉得写得很好。熟悉我的粉丝都清楚,我很少推荐书,这次推荐这本书是我目前正在读的,这是本老书了,关于回归模型的,我觉得写的很好。看了这本书后发现,以前R的赋值符号是下面这种,就完全理解了,这是进化后的箭头。

2024-06-26 11:50:23 350

原创 新手(初学者)学R语言第一课,从学正确导入数据开始

因为R语言是个注重格式的语言,目前导入数据的R包种类繁多,有些R包存在格式转换问题,所以导入数据后分析容易出现各种各样的问题。有人可能会说这是我scitb5函数的bug,但其实不是是这句很普通代码的报错,一句涉及数据转换的代码,这句代码应该很常用,涉及很多场景,很多R包都会用。第二:如果是SPSS数据,咱们可以使用foreign包,如我乳腺癌的例子,to.data.frame=T这个一定要有,因为这句等于把数据转成数据框。我推荐两种方法导入数据,这些都是我长期实践觉得比较稳定,不容易出错的,

2024-06-21 09:05:28 1090

原创 代码+视频,手把手教你下载NHANES死亡数据

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。既往再文章《Nhanes临床数据库挖掘教程1----数据库下载》中,咱们已经初步介绍了Nhanes临床数据的下载,但是这个数据没有涉及到死亡结局和随访时间,本次继续视频介绍如何下载死亡结局相关的数据。地址为:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx。

2024-06-14 09:43:53 733

原创 R语言使用survivalsvm包进行支持向量机生存分析

age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。开始我看到结果有点懵,这是预测啥呀,这个不是预测概率,我看到有些文章把这个当作概率来跑,还画了roc和决策曲线什么的,肯定不对的。因此预测得就是生存时间啦。

2024-06-12 09:41:16 1110

原创 关于目前ggrcs包的报错解决方案

我查看了一下,目前报错来源于新版本后的RMS包,主要是预测函数的报错,这个只能等R包作者来修复这个错误。目前需要急用的话,我提供了一个方案,请看下面视频操作。目前有不少粉丝私信我说使用ggrcs包出现如下错误。关于目前ggrcs包的报错解决方案。

2024-06-10 09:25:52 1273 9

原创 NHANES数据(复杂调查数据)COX回归亚组交互函数1.8尝鲜版(P for interaction)发布

在SCI文章中,交互效应表格(通常是表五)能为文章锦上添花,增加文章的信服力,增加结果的可信程度,还能进行数据挖掘。我来解释一下data是数据,必须数据框形式,x是你研究的目标变量,y是你的结局变量,Interaction是你的分层变量,这个必须是分类变量并转成因子,cov是你的协变量。可以看到DMDMARTL=0的时候,HR是0.99,P值是0.203,DMDMARTL=1的时候HR是1.01,P值是0.141,和咱们算出来是非常接近的,所以可靠性是没有问题的。下面我来介绍一下,咱们先导入数据。

2024-06-07 09:05:31 1107

原创 代码+视频,R语言如何从可信区间推断P值

它们不正确的主要背景是小样本,其中结果是连续的,并且分析是通过t检验或方差分析完成的,或者结果是二分的,并且对置信区间使用了精确方法。但是,即使在这种情况下,在包含 60 名或更多患者的大型研究中,这些方法也将大致正确。但是在:一些已发表的文章报告了置信区间,但没有给出相应的P值,如荟萃分析。在我们的一些重抽样中也可以得出可信区间,但是没P值。对于非常小的 P 值,P 公式是不可靠的,如果您的 P 值小于 0.0001,则只需将其报告为 P

2024-06-05 09:03:53 277 1

原创 ggscidca包2.3版本发布, 10分钟让你成为决策曲线高手

age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。值得注意的是,如果是多个时间点的决策曲线,时间的个数和模型的个数还有数据的个数必须一致,因为是一个个的对应跑模型的,下面我来示范一个错误的。

2024-05-29 09:14:51 1032

原创 代码+视频,总结R语言常用的几种按条件转换数据的方法

在科学研究中免不了和数据打交道,收集到原始数据后我们经常需要对其进行清洗、转换才能得到我们需要的数据。今天我总结了一下自己常用的一些多条件的数据转换方法,在临床中遇到问题能多一种选择,下面视频操作演示一下。总结R语言常用的几种按条件转换数据的方法。

2024-05-24 09:03:53 268

转载 nhanes数据行ROC曲线并BOOT重抽样获取可信区间

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。既往咱们已经多篇文章对nhanes数据进行了分析介绍,粉丝私信问:如何行ROC分析,并重抽样获取可信区间。地址为:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx。

2024-05-20 09:15:53 138

原创 R语言使用 ggscidca包优雅的绘制支持向量机决策曲线

数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。进行分析前还需对数据进行预处理,如果你是多分类的,并且数据差异大,可以使用分层抽样,尽量是数据匹配一下,方法详见我既往文章《R语言两种方法实现随机分层抽样》,我这里是二分类,我就不弄了。最后向大家汇报一下,多模型的决策曲线和混合模型的决策曲线已经写好,下周上传,到时我再出个视频介绍一下。定义一个标准化的小程序。

2024-05-17 09:23:11 485

原创 R语言手把手教你进行支持向量机分析

数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。公众号回复:体检数据,可以获得数据。上图给出了一些模型的基本参数,默认情况下,gamma为预测变量个数的倒数,cost为1。进行分析前还需对数据进行预处理,如果你是多分类的,并且数据差异大,可以使用分层抽样,尽量是数据匹配一下,方法详见我既往文章《R语言两种方法实现随机分层抽样》,我这里是二分类,我就不弄了。

2024-05-14 09:07:46 1228

原创 代码+视频,R言语处理数据中的缺失值

在SCI论文中,我们不可避免和缺失数据打交道,特别是在回顾性研究,对于缺失的协变量(就是混杂因素),我们可以使用插补补齐数据,但是对于结局变量和原因变量的缺失,我们不能这么做。部分人的做法是直接删除掉这部分的数据(如SEER数据库),有些高分SCI杂志的审稿人会问你缺失数据的情况和你是怎么处理的,如果我们能附上一个缺失数据和未缺失数据比较的表格,可以起到一表抵千言万语的作用,如下图。今天咱们视频演示一下如何R语言做出上面的表格。R言语处理数据中的缺失值。

2024-05-11 10:18:09 352

原创 R语言两种方法实现随机分层抽样

其实用起来非常简单哈,data就是你的数据,strataname就是你分层的变量名字,我们这里当然是SEX性别啦,size就是你抽取的数量,method是抽取的方法,有不替换的简单随机抽样(srswr)、替换的简单随意抽样(srswr)、泊松抽样(Poisson)、系统抽样(systematic sampling);这是个体检相关的数据,公众号回复:体检数据,可以获得这个数据。如果要提取数据,需要使用ID_unit这个变量,这是数据的标识,咱们通常会把分层抽样的数据用来建模,其余的数据用来验证。

2024-05-10 17:39:35 648

原创 scitb5函数2.1版本(交互效应函数P for interaction)发布----用于一键生成交互效应表、森林图

数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值。加下来说一个包含的问题,在既往函数中,我要求协变量COV是要包含分层变量,不然就会报错,但也有些粉丝说这样有时候不够灵活,新版本中这个包含规则也是可以关掉的,我重新设置一下协变量h额分层。生成结果,这里的Y是连续变量,所以是线性回归。导入我们的早产数据和函数。

2024-05-08 11:51:57 759

原创 生存分析亚组交互函数scitb5.coxph 1.6尝鲜版(P for interaction)发布----用于一键生成交互效应表、森林图

然后一句话代码就可以生成表格,data是你的数据,必须是数据框形式,x是你研究的目标变量,y是你的结局变量,time是你的时间变量,Interaction是你的分层变量,这个必须是分类变量并转成因子,cov是你的协变量,family="cox"这个是固定的。Cox回归也是可以一键生成森林图的,既往森林图黑色我觉得有点单调,改成蓝色了。加下来说一个包含的问题,在既往函数中,我要求协变量COV是要包含分层变量,不然就会报错,但也有些粉丝说这样有时候不够灵活,新版本中这个包含规则也是可以关掉的,比如以下情况。

2024-05-07 09:04:27 782 1

原创 代码+视频,R语言绘制生存分析模型的时间依赖(相关)性roc曲线和时间依赖(相关)性cindex曲线

ROC曲线分析是用于评估一个因素预测能力的手段,是可以用于连续型变量分组的方法。在生存分析中,疾病状态和因素取值均会随时间发生变化。而标准的ROC曲线分析将个体的疾病状态和因素取值视作固定值,未将时间因素考虑在分析之中。在这种情况下,使用时间依赖性ROC无疑是更好的选择。R语言绘制生存分析模型的时间依赖(相关)性roc曲线和时间依赖(相关)性cindex曲线。今天咱们视频来演示一下时间依赖ROC曲线绘制。

2024-04-28 10:11:31 652

原创 R语言使用sjPlot包优雅绘制回归模型的交互效应图

这是一个有关于老年人护理的数据,我介绍一下等会我要用到的变量,neg_c_7:7个项目的负面影响,c12hour:每周平均护理时数,BARTHTOT:总分 BARTHEL INDEX,c161sex :照顾者的性别,得出不同性别,在不同barthtot 分数段中,护理时间和负面影响的关系,我们可以看到barthtot 分数70分这段,护理时间越长,负面影响越高,男女都是一样,儿30分这段随着护理时间延长没有什么变化。除了2项交互,terms- 参数还可以接受三个模型项,因此您还可以计算三向交互的边际效应。

2024-04-25 09:24:29 938

原创 代码+视频,R语言对数据进行多重插补后回归分析

我们在临床做回顾性研究分析中经常要面对数据缺失的问题,如果数据缺失量大就会对我们的研究结果产生影响,近年来,对数据进行多重插补广泛应用于SCI论文中。我们在之前的文章中已经演示了使用SPSS对数据进行多重插补并分析。今天,我们通过视频演示使用R语言的Mice包来演示多重插补并对数据进行分析。R语言对数据插补并进行分析。

2024-04-19 09:36:35 652

原创 R语言使用installr包对R包进行整体迁移

今天分享一个R语言的实用小技巧,如果咱们重新安装了电脑(我重装了电脑)或者因为需要卸载旧版本的R软件,安装新版本的R,那么必然会造成R包的库缺失,需要重新下载,有些还不是官方的R包,下载非常麻烦。from就是我旧版本的R软件的位置,to就是我新版本的R软件的位置。这个R包的迁移的函数是copy.packages.between.libraries函数,有点长,大概的格式就是下面这样的。咱们可以使用installr包把旧版本的R的R包库转移到新的版本,非常简单。我觉得还是挺简单使用的,本期结束啦。

2024-04-16 09:02:31 1350 3

原创 18篇文章带你深入浅出了解亚组交互作用(p for Interaction)及可视化分析

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,进行可视化后可以清晰的表明变量之间的关系。2. SPSS联合Excel进行logistic回归亚组交互效应(交互作用)的可视化分析,不用代码操作也能做出交互效应图。编写NHANES亚组交互函数,可以一键生存亚组分析交互效应表并绘制森林图,目前已经更新到1.7版本。5.使用visreg包快速进行R语言logistic回归交互项的可视化分析。

2024-04-14 10:48:07 5780

原创 代码+视频,R语言手动绘制连续线条的校准曲线(Calibration curve)(3)

校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距。我们既往已经通过多篇文章介绍了等分的校准曲线绘制,今天来视频介绍一下上图这种连续的,线条样的校准曲线绘制。

2024-04-12 10:14:33 626

转载 两种方法手把手教你R语言多分类变量亚组相加交互模型分析

不少粉丝问如何进行多分类的相加交互模型分析,今天咱们来演示一下,继续使用咱们的不孕症数据(公众号回复:不孕症,可以获得这个数据)Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。这样fage就是年龄进行等分后的变量,是个3等分的变量,spontaneous自然流产次数也是个3等分的变量,等下咱们就是研究这两个变量的交互。有文献表明,单单只用乘法交互效应低估了疾病协同的危险性,从而低估了发病率。

2024-04-09 09:11:35 1074

原创 代码+视频,手动绘制logistic回归预测模型校准曲线(Calibration curve)(2)

我们既往文章《手动绘制logistic回归预测模型校准曲线》已经进行了手动绘制logistic回归预测模型校准曲线,今天继续视频来介绍外部数据的校准曲线验证和分类数据的校准曲线。一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距。R语言手动绘制logistic回归预测模型校准曲线(Calibration curve)(2)校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。

2024-04-07 12:47:48 444

原创 R语言使用 ggscidca包优雅的绘制竞争风险模型决策曲线

对于不同的结果, ggscidca包的结果是根据决策曲线发明者大佬AndrewVickers博士提供的stdca.R函数生成结果的,stdca.R函数其实是可以进行竞争风险模型分析的,但是stdca.R单独生成结果有点小问题(其实不算问题,应该认知不同),我稍微修改了一点,让它更易于分析竞争风险模型(核心代码没有动),我反复比对了stdca.R的代码原理和数据生成的结果,认为没有错,那只能是dcurves包错了。这步不做就没法分析,你原先就是0,1,2形式的不用改,直接下一步就行。

2024-04-03 09:09:16 1027

原创 分享一个nhanes数据报错的解决方案

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。今天分享一个小的NANES报错小方案,目前有不少粉丝私信我是说:使用survey包的时候出现如下图错误:stratum has only one PSU at stage 1。这个报错是因为survey进行权重抽样计算的时候PSU分配到单一的变量所致,咱们导入包的时候可以对它进行一下设置。

2024-03-31 11:01:53 582

原创 代码+视频,手动绘制logistic回归预测模型校准曲线(Calibration curve)(1)

今天我们来视频演示第一种,手动绘制的好处在于加深你对绘图的理解,而且能个性化的进一步处理图形。第一种绘图本质就是我们的折线图,一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距.R语言手动绘制logistic回归预测模型校准曲线(Calibration curve)(1)校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。另外一种是calibration函数重抽样绘制连续的校准图。

2024-03-30 11:38:30 621

原创 R语言使用dietaryindex包计算NHANES数据多种营养指数(2)

健康饮食指数 (HEI) 是评估一组食物是否符合美国人膳食指南 (DGA) 的指标。Dietindex包提供用户友好的简化方法,将饮食摄入数据标准化为基于指数的饮食模式,从而能够评估流行病学和临床研究中对这些模式的遵守情况,从而促进精准营养。该软件包可以计算以下饮食模式指数:• 2020 年健康饮食指数(HEI2020 和 HEI-Toddlers-2020)• 2015 年健康饮食指数 (HEI2015)• 另类健康饮食指数(AHEI)• 控制高血压指数 (DASH) 的饮食方法。

2024-03-28 08:42:14 2203 2

原创 代码+视频,R语言logistic回归交互项(交互作用)的可视化分析

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,不仅如此,交互作用还可以使用来进行数据挖掘。在既往文章中,我们已经介绍了怎么使用R语言可视化visreg包对交互作用进行可视化分析(见下图)使用visreg包后我们对图形的细节掌控力不够,今天我们视频介绍使用重新绘制手动图形,这在SCI论文中非常实用,几乎可以做出所有的交互可视化,也有利于我们了解制图原理。

2024-03-22 10:00:48 1807

原创 R语言使用 ggscidca包优雅的绘制随机森林决策曲线

DCA(Decision Curve Analysis)临床决策曲线是一种用于评价诊断模型诊断准确性的方法,在2006年由AndrewVickers博士创建,我们通常判断一个疾病喜欢使用ROC曲线的AUC值来判定模型的准确性,但ROC曲线通常是通过特异度和敏感度来评价,实际临床中我们还应该考虑,假阳性和假阴性对病人带来的影响,因此在DCA曲线中引入了阈概率和净获益的概念。应粉丝的要求在,在新版本ggscidca包添加了虚线功能,你可以在阈值的两点添加虚线,加上线条也是可以的,线条还可以改颜色,线型和大小。

2024-03-20 09:09:31 585 2

原创 代码+视频,R语言使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间

BOOT重抽样在我们统计中处理数据还是很有用的,本期我们来介绍一下怎么使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间,这也是一个粉丝向我问的问题,我觉得蛮有典型性和实用性的,因此就拿出来讲讲。bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大于500次以上)次,然后得到N个统计结果,然后进行区间分析,得到最终结果。

2024-03-15 08:28:57 727

原创 R语言tidycmprsk包分析竞争风险模型

既往我们在文章《手把手教你使用R语言做竞争风险模型并绘制列线图》和《一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线》已经介绍了使用cmprsk包绘制和QHScrnomo包进行分析,今天咱们来介绍一下tidycmprsk包,它也是基于cmprsk包进行分析,但是功能更多,绘制图形更加精美。接下来咱们来演示多因素分析,如果你不指定结局的话,会默认的把第一个结局当成存活,最后一个结局当成竞争风险指标,就是咱们常见的0,1,2形式。咱们也可以进一步指定,这样清楚一点。

2024-03-12 09:02:09 854 2

原创 NHANES数据(复杂调查数据)亚组交互函数1.7(P for interaction)发布-纠正了目前的一个问题

大家好,有粉丝私信我说NHANES数据(复杂调查数据)亚组交互函数1.版本交互函数有点问题,我查看了一下,有个代码调用失效了。就是下面这个,本来我是这样调用数据的。应该是由于R版本或者survy包升级后导致这个调用代码失效了,导致了调查数据没有加权,给您带来不便敬请见谅。

2024-03-08 11:42:44 468

原创 首发ggscidca包,来来来---绘制个不一样的决策曲线,让你审稿人眼前一亮

上图这个图形我考虑过ggplot2包的多个函数,如geom_bar,geom_raster,geom_col等,其中geom_col本来最满意,可以绘制出渐变风格的区域条形图,但是geom_col不好嵌入字体(应该是我技术水平还不够,以后水平高了再重新写一下),后面刚好看到其他博主使用geom_rect来复现这个图片,复现得还挺不错的,后面就参考了一部分他的方法,geom_rect主要的有点是灵活多变,可以应对不同的情况。生成图形后,如果你想对这个条形图进行调整,也是可以的,要关注函数生成的2行信息。

2024-03-05 09:08:08 1108

原创 代码+视频R语言使用BOOT重抽样获取回归方程系数95%可信区间

bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大于500次以上)次,然后得到N个统计结果,然后进行区间分析,得到最终结果。bootstrap自采样对于小样本数据计算效果较好,也可以在线性方程中通过bootstrap自采样计算并绘制出可信区间。本期视频介绍R语言使用BOOT重抽样获取回归方程系数95%可信区间。

2024-03-01 09:34:02 250

早产数据,可以用于文章中的统计学方法研究

早产数据,可以用于文章中的统计学方法研究

2023-02-21

2000年美国总统全国选举数据,可用于数据分析

2000年美国总统全国选举数据,可用于数据分析

2023-02-21

美国芝加哥1987年至 2000年大气污染与死亡数据2(第二部分),可用于时间相关序列数据分析

美国芝加哥1987年至 2000年大气污染与死亡数据2(第二部分),可用于时间相关序列数据分析

2023-02-17

美国芝加哥1987年至 2000年大气污染与死亡数据,可用于数据分析

美国芝加哥1987年至 2000年大气污染与死亡数据,可用于数据分析

2023-02-17

患者的体检数据2(第二部分),可以用于进行数据分析

患者的体检数据2(第二部分),可以用于进行数据分析

2023-02-16

体检数据,可用于进行文章中的数据分析

体检数据,可用于进行文章中的数据分析

2023-02-16

原发性胆道胆管炎数据,可以用来做数据分析

原发性胆道胆管炎数据,可以用来做数据分析

2022-12-10

nhanes插补数据,可以用于nhanes插补数据的分析

nhanes插补数据,可以用于nhanes插补数据的分析

2022-12-09

森林图数据,可以用于绘制森林图

森林图数据,可以用于绘制文章中的森林图

2022-11-10

纽约房价数据,可用于数据分析

纽约房价数据,可用于数据分析

2022-11-03

自己提取的nhanes数据库

自己提取的nhanes数据库,可用于数据分析

2022-11-03

利用广义可加模型对分类数据进行曲线拟合代码

利用广义可加模型对分类数据进行曲线拟合代码

2022-07-12

一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

一步到位:手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

2022-06-20

利用重抽样获取广义可加模型曲线的可信区间重抽样代码

利用sample函数重抽样获取广义可加模型函数曲线的可信区间,这可是一个非常实用的技能,假设我们想了解某连续变量和结果之间的关系,可以使用mgcv包获得两者之间的曲线关系,但是mgcv不能做出95%可信区间,我们可以通过重抽样获取其可信区间。这可是很多的付费课程,付费软件的功能哦。

2022-05-18

SPSS中介效应分析插件(Process和mediate插件)

包含Process和mediate插件

2022-03-09

SPSS主成分分析绘图操作

SPSS主成分分析绘图操作

2022-01-26

stata临床决策曲线包.rar

stata临床决策曲线包,包含有dca包和stdca包

2021-05-31

eicu数据库考试答案.rar

eicu数据库考试答案,我自己写的

2021-01-23

nomocox.zip

stata制作列线图的包(package)

2021-01-20

nomolog.zip

stata制作列线图的包(package)

2021-01-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除