公共数据库+预测模型=SCI二区!这篇预测模型论文写得很规范

详情请点击下方:

没有数据,没有实验条件怎么发表SCI论文?欢迎参加孟德尔随机化方法培训班!!!


想学习如何构建预测模型的一定要看这篇文章!到2023年,抑郁症已成为全球疾病负担的首位,特别是中老年残疾人,往往有更严重的抑郁倾向。中国学者使用CHARLS数据库构建了中国中老年肢体残疾者抑郁的预测模型,筛选出与抑郁高度相关的预测变量。

该模型的构建可以帮助临床工作者快速筛选出患抑郁症风险较高的中老年人肢体残疾人群,从而实现对抑郁症的早发现、早干预、早治疗。

2024年4月23日,山东大学的学者用CHARLS数据库,在期刊BMC Public Health(医学二区top,IF=4.5)发表了题为:“A predictive model for depression in Chinese middle-aged and elderly people with physical disabilities”的研究论文,本研究旨在开发一个抑郁预测模型,基于中老年人抑郁的危险因素评估中国中老年人身体残疾患抑郁症的可能性,以便为抑郁症高风险的身体残疾中老年人提供早期识别、干预和治疗。

65b0f971b186cac24db0f5ababf0812d.png

本公众号回复“ 原文”即可获得文献PDF等资料

根据分析,研究团队得出了以下结果:

  • 老年人(65岁以上)的抑郁症患病率高于中年人(45~65岁)。

  • 对于中年组,在45 ~ 50岁之间,年龄是保护因素,大于50岁是危险因素,并且随着年龄的增长相关性更强。年龄越大,相关性越弱。

下面我们一起来详细看看!

主要研究结果

1.研究设计

本研究选取中国健康与退休纵向研究(CHARLS)2015年至2018年的数据,最终共纳入1052名45岁以上有身体残疾的参与者。  

  • 抑郁评估:流行病学研究中心抑郁量表(CES-D10),量表包含10个项目,每个项目得分:0(很少或根本没有),1(有时),2(大部分时间),3(所有时间)。总分在0~30分之间,评分≥10分定义为抑郁症。

  • 中老年人的定义:45~65岁的为中年人,65岁以上的为老年人。

  • 身体残疾人群肢体残疾定义为由于肢体残疾或肢体躯干瘫痪或畸形导致人体运动系统不同程度的功能丧失或功能障碍。

7a987c1cd7aeae219ac7bdb64bb7d2e9.png

    

2.基线特征

研究共纳入1052名有身体残疾的老年人,其中497人未患抑郁症(47.2%),555名患有抑郁症(52.8%)。

  • 结果显示,中国中老年残疾人士的抑郁症患病率超过50%80%以上的抑郁症患者生活在缺乏医疗保护的农村地区。

b777123a0faf9ae5cd8abb4e753838e4.png

3.年龄和抑郁的关联

研究者绘制了年龄与抑郁之间的限制性立方样条回归模型对于中年组,年龄在45 ~ 50岁之间是保护因素,大于50岁是危险因素,并且随着年龄的增长相关性更强。年龄越大,相关性越弱。

  • 中年组(45~65岁)648人,其中335人(51.6%)患有抑郁症。

  • 老年组(65岁以上)共有404人,其中220人(54.5%)患有抑郁症。

6ba8adc7ead566b98c2b4fdd7d2bf01e.png

注:

实线表示ORs(优势比),阴影形状表示95% CI(置信区间)

4.LASSO回归分析结合二元logistic回归分析筛选预测变量

在LASSO选择路径图(图3A)中,显示了λ的两个具体值:lambda.min和lambda.1se。

  • LASSO路径图如图显示,随着系数的降低,预测因子也相应降低。研究团队基于lambda筛选了22个预测变量。

26039a8eb8e423993fb2bfe4fecfcd67.png

将经由SPSS软件筛选的18个具有统计学意义的预测变量纳入二元logistic回归分析,将有序分类变量设为协变量,结果如下表所示。

51ed51c3c9cf39dcd58b34c663f5be21.png

6cfc614151ad913c9847d7e1adae8d14.png

  • Hosmer-Lemeshaw检验显著性为0.819,表明模型拟合良好。

根据P<0.10的原则,我们从表中筛选出性别、居住地址、近视、听力、未来可能有助力、过去一年是否酗酒、上厕所困难、准备热餐困难、残疾无法工作共9个变量来构建模型。

5.中国中老年肢体残疾者抑郁预测模型的构建与验证

在确定了构建中国肢体残疾中老年人抑郁预测模型的最终变量后,我们在Rstudio中使用“rms”包构建模型,并使用包中的“nomogram”函数生成列线图。

a2e33f5696045324dc5a130a3dda201a.png

  • 中国中老年人躯体残疾抑郁预测模型的ROC曲线下面积为0.714 (95% CI: 0.673 ~ 0.751),如图B所示。

  • 模型的召回率为0.655,精确率为0.692,F1_score为0.672,Brier评分为0.213。平均校准曲线的绝对误差均值为0.016,如图C所示。

cc12f15b07a35ef7c334b67e7db5e790.png

  • DCA曲线显示,在较宽的阈值范围内,使用包含9个预测变量的模型比使用单个预测变量的模型具有更高的垂直坐标值。这表明本研究构建的预测模型具有更大的增益,见图D。

  • 净增益曲线显示,使用预测变量的患者发生抑郁的风险较高,见图E。

7c67eb2bb6dbd8b3a05524fee55d43a3.png

内部验证的结果如下图:

  • ROC曲线下面积为0.716,见A。校准曲线的平均绝对误差为0.018,见图B。

4f0a72e40fb4506292cc313a4178f32e.png

外部验证的结果如下图:

  • ROC曲线下面积为0.716 (95% CI: 0.660-0.772),如图A所示。校准曲线的平均绝对误差为0.016,如图B所示。

e7950f97e7d5daed5e22fe6dea9eafd4.png

统计学方法

1.LASSO回归分析结合二元logistic回归分析筛选预测变量

我们将数据集随机分为训练集和验证集,比例为7:3。在训练集中,我们使用R软件包“glmnet”(版本4.2.2)进行LASSO回归分析。对训练集中的变量进行初步筛选后,使用SPSS (version 26)对上述变量进行二元logistic回归分析

898f187ecdeb0d8be6afba6858ec5403.png

2.使用函数构建模型

筛选中国中老年肢体残疾抑郁预测模型的预测变量后,我们利用设计包中的lrm函数在Rstudio中构建模型。我们使用“rms”包中的“nomogram”函数将模型可视化。

e06f3d8accda31fe3a2659aa0f2b6903.png

3.校准曲线

使用校准曲线评估预测模型的校准性能。通过比较实际观测值与模型预测值之间的关系,有助于研究人员了解模型在不同概率区间下的预测精度水平。

58e93ad8605ce0c6b21239db0eb3e6de.png

4.决策曲线

使用决策曲线分析(DCA)来进一步评估评估不同阈值下分类模型决策性能的图形化工具,权衡分类模型的预测结果,确定最适合决策的阈值。

745f94a6c62b8d7ee62d488926812792.png

5.内部验证

内部验证是模型开发的必要步骤,其意义在于量化所开发模型的预测性能。本研究采用Bootstrap重采样方法进行内部验证。

99576714e2f7159eef0a22f1ba300100.png

6.外部验证

使用验证集中的C-index校准曲线对模型进行外部验证。

8dcac8cc14f34b7663641aac3b28b307.png

本公众号回复“ 原文”即可获得文献PDF等资料

后记

少有学者采用CHARLS数据库构建预测模型,但本文非常规范!对中老年肢体残疾者构建抑郁预测模型,发文二区!

本文的统计学方法步骤清晰,研究思路明确,方法也较为详细。先用LASSO回归分析结合二元logistic回归分析筛选变量,将具有统计学意义的变量纳入函数,绘制列线图,构建模型。然后对模型进行评估和验证,依次使用校准曲线、DCA分析、内部验证和外部验证来评估模型的可靠性。

如果你有对预测模型感兴趣,或有思路但不知道如何开展,不妨来看看郑老师团队开设的预测模型一对一学习指导,全程数据分析指导!!


详情请点击下方:

郑老师课程 | 医院临床数据分析与预测模型私教班,1V1全程指导! (qq.com)

如果二分类预测模型的假阳性率(False Positive Rate,FPR)比真阳性率(True Positive Rate,TPR)高,说明模型在负例样本上的误判较多,可能存在一定的问题。针对这种情况,可以考虑以下几个解决方案: 1. 调整分类阈值:分类模型会根据设定的阈值将样本划分为正例或负例。通过调整阈值,可以平衡模型在正例和负例之间的预测结果。降低阈值可能会提高真阳性率,但也会增加假阳性率。需要根据具体情况进行权衡和调整。 2. 特征工程:通过对特征进行优化和选择,可以提升模型的性能。例如,考虑引入更多相关的特征或对现有特征进行变换、组合等,以提高模型对正例和负例的区分能力。 3. 选择合适的算法模型:不同的算法模型对于不同类型的数据和问题有不同的适用性。可以尝试使用其他算法模型或集成多个模型来改善分类结果。 4. 数据平衡处理:如果训练数据存在类别不平衡的情况,可以采用过采样、欠采样或者生成合成样本等方法来调整样本分布,以提高模型对负例的识别能力。 在实际应用中,发表论文并不仅仅依赖于模型的性能,还需要考虑研究问题的创新性、实验设计和结果的可靠性等因素。如果你的模型在假阳性率方面存在一些问题,可以尝试改进模型,并将改进后的结果与之前的结果进行对比和评估。最终是否能够发表SCI论文需要根据研究领域的要求和具体情况来综合考虑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值