自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 12.常用统计分析方法——聚类分析

聚类分析

2024-01-23 17:33:02 1230

原创 10.常用统计分析方法——主成分分析和因子分析

主成分及因子分析

2024-01-23 17:31:45 2410

原创 实用技巧——缺失数据的处理

缺失数据的分类:(1)完全随机缺失 若谋变量的缺失数据与其他任何观测或未观测变量都不相关,则数据为完全随机缺失(MCAR)。(2)随机缺失 若某变量上的缺失数据与其他观测变量相关,与他自己的未观测值不相关,则数据为随机缺失(MAR)。(3)非随机缺失 若缺失数据不属于MCAR和MAR,则数据为非随机缺失(NMAR)。大部分处理缺失数据的方法都是假定数据是MCAR或MAR,此时可以忽略缺失数据的生成机制,并且(在替换或删除缺失数据后)可以直接对感兴趣的关系进行建模。

2024-01-22 23:06:30 1119

原创 8.临床预测模型验证——交叉验证/Bootstrap法

将一定比例的数据挑选出来作为训练集,将其余未选中的样本作为测试集,先在训练集中构建模型,再在测试集中做预测。内部验证:手动将样本随机分为训练集和测试集,先在训练集中构建模型,再在测试集中进行测试。简单交叉验证:将原始的数据随机分成两组,一组作为训练集,一组作为测试集。K折交叉验证:将数据随机分为K个子集,对每个子集分别做一次测试集,其余的K-1组子集数据作为训练集,最终得到K个模型,用K个测试集的平均结果作为K-折交叉验证的性能指标。

2024-01-16 23:20:50 3173

原创 7. 预测模型评价——DCA曲线

ROC曲线分析,主要是评价模型的准确性,但无论如何选择,都会存在假阳性和/或假阴性的问题。如果疾病危害较小,尚无法治愈,则可以适当增加假阴性,避免假阳性;若疾病的危害大且晚发现预后差,则可以适当增加假阳性,避免假阴性。横坐标为阈概率(threshold probability),纵坐标为净获益( net benefit,NB)。DCA曲线中存在两种极端情况的曲线:1.横的曲线表示所有样本都是阴性,所有人都没有干预,净获益率为0.

2024-01-16 22:08:10 4860 2

原创 7.评价预测模型——C指数,NRI,IDI计算

理解即为343人在新旧模型中被认为是低风险,21在新模型中为中风险,旧模型中为低风险,1人在新模型中高风险,旧模型中低风险,以此类推。在阴性组,预测阳性的概率比旧模型的小。在table3中,c1是原来模型没有预测对,新模型预测对的,同样的道理,b1是原来模型预测对,但新模型给预测错的,于是(c1 − b1)/N1便是疾病组或者event组增加的重分类的正确比。若IDI>0,则为正改善,说明新模型比旧模型的预测能力有所改善,若IDI<0,则为负改善,新模型预测能力下降,若IDI=0,则认为新模型没有改善。

2024-01-16 17:37:48 5129 1

原创 7.评价预测模型——Calibration校准曲线

Calibration校准曲线:就是将实际发生率和预测发生率绘制的散点图。是对Hosmer-Lemeshow拟合优度检验的结果可视化。基本原理:首先利用列线图预测每位研究对象的预测值,并将其按从低到高的顺序排列,根据四分位数将队列分为4组(或者根据其他分位数分组),然后分别计算每组研究对象的预测值和相应的实际值得均值,并将两者结合起来作图得到4个校准点,最后将这4个校准点连接起来得到预测校准曲线。

2024-01-14 21:00:43 4543 2

原创 7.评价预测模型——ROC曲线

表中有4个可能结果,其中2个结果表明被评价诊断方法的诊断结果是正确的,即病例被诊断为阳性(真阳性;diag.col参考线颜色,diag.lty参考线类型,curve.col, curve.lty, curve.lwd 设置ROC曲线的颜色,类型,宽度,xaxs,yaxs设置原点相交。拟合优度检验计算每个个体结局事件的预测值,并按照预测值的大小对数据进行分组,一般分为5-10组,进行Hosmer-Lemeshow拟合优度检验,考察预测值与实际值的吻合程度,p>0.05,说明模型拟合效果较好。

2024-01-13 15:45:12 2001 1

原创 6. 临床预测模型——可视化列线图

基本原理:根据多因素模型中各自变量的偏回归系数的大小,给每个自变量进行赋分,然后将各个自变量评分相加得到总评分,根据总评分估计出个体结局事件的预测情况。

2024-01-12 15:17:57 1899 2

原创 4.临床预测模型——竞争风险模型

竞争风险事件:指出现研究对象感兴趣事件的同时,其他终点事件也有可能出现,这些终点事件将阻止感兴趣事件的出现,或使其发生概率降低,各终点事件之间形成所谓的竞争关系。竞争风险模型仅仅关心研究对象发生的第一个终点事件,而后发生的其他终点事件称为删失事件(censoring)。如基线未发生心血管疾病的研究对象在观察期内死于癌症、车祸等其他原因前并未发生心血管疾病,就不能为CVD的发病做出贡献,传统生存分析将其他原因死亡的个体,失访个体和存活个体记为删失数据,会高估CVD的累积发病率。

2024-01-07 22:56:20 1833 3

原创 3. 临床预测模型——生存分析

参考。

2024-01-07 17:17:02 421 1

原创 2. 临床预测模型——Logistic回归

详见。

2024-01-07 17:03:19 1216 1

原创 1.临床预测模型——线性回归

相关与线性回归

2024-01-07 15:30:22 885 1

原创 实用技巧——亚组分析表格快速绘制

可能不是最方便的方法,但是自己学习过程总结的。如果有更好的方法欢迎各位大佬们补充!!!

2023-12-12 16:10:54 622

原创 实用技巧——绘制森林图

森林图绘制教程

2023-12-12 02:03:35 3872 3

原创 4. 统计描述和基线表格绘制

统计描述

2023-12-03 13:01:53 1775 1

原创 绘制高级频率分布直方图——ggplot2

1.ggplot直方图绘制fill:可以直接填充其他喜欢的颜色,weight表示需要计算的频数。将weigt去掉,即可。

2023-12-02 18:35:19 1934

原创 8.常用统计分析方法——生存分析

生存分析

2023-06-17 08:43:01 5712 1

原创 6.常用统计分析方法——多重线性回归

多重线性回归

2023-06-16 10:00:00 3497 1

原创 7.常用统计分析方法——Logistic回归

logistic回归

2023-06-16 09:00:00 11943 2

原创 2.R语言绘图基本知识

基础绘图

2023-06-16 08:00:00 2490 1

原创 9. 常用统计分析方法——Poission回归模型

poission分布及poission回归分析

2023-06-16 06:00:00 1516 1

原创 1.R语言基础知识

建议下载最新版本,避免有些R包无法运行。此外选择镜像下载,下载速度会快很多。国内的镜像比较多,所以可以根据自己的所在位置选择合适的镜像。因为笔者在北京,就选择了北大镜像下载。安装的话建议直接默认,点击下一步,装在C盘的位置。

2023-06-14 08:00:00 4193

原创 5. 基础统计方法——关联性分析/简单线性回归

关联分析和简单线性回归

2023-06-07 16:16:57 2848 1

原创 5.基本统计方法-分类变量的组间比较

分类变量的统计推断

2023-06-05 11:07:24 4085

原创 5.基本统计方法-连续性变量的组间比较

连续性变量的组间比较

2023-06-04 16:07:19 2975 1

原创 12. 临床诊断试验评价

临床诊断试验评价

2023-05-24 10:44:10 1373

4.临床预测模型-竞争风险模型

练习数据

2024-01-07

2. 临床预测模型-Logistic回归

练习数据

2024-01-07

1.临床预测模型-线性回归

操作数据

2024-01-07

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除