R语言复现:轨迹增长模型发表二区文章 | 潜变量模型系列(2)

培训通知

Nhanes数据库数据挖掘,快速发表发文的利器,你来试试吧!欢迎报名郑老师团队统计课程,4.20直播。

案例分享

2022年9月,中国四川大学学者在《Journal of Psychosomatic Research》(二区,IF=4.7)发表题为:"Associations between trajectories of depressive symptoms and rate of cognitive decline among Chinese middle-aged and older adults: An 8-year longitudinal study" 的研究论文。

594f693ac32a54a1ba5c214769b660dd.png

本公众号回复“ 沙龙 ”即可获得   PPT,数据等资料

一、摘要

标题:中国中老年人抑郁症状轨迹与认知能力下降率之间的关系:一项为期8年的纵向研究

目的: 探讨中国中老年人群抑郁症状轨迹与认知能力下降率的关系。

方法: 采用中国健康与退休纵向研究(CHARLS)的人群队列数据。该队列随访8年,并于2011年、2013年、2015年和2018年评估抑郁症状和认知表现。采用基于组的轨迹模型(GBTM)来识别抑郁症状的异质性轨迹。采用线性混合模型(lmm)来检验抑郁症状轨迹与整体认知功能、情景记忆和执行功能下降率之间的关联。

结果9264名中老年人共分为5个抑郁症状轨迹组:持续低(n = 3206, 34.6%)、持续中(n = 3747, 40.5%)、持续加重(n = 899, 9.7%)、持续减轻(n = 929, 10.0%)、持续加重(n = 483, 5.2%)。抑郁症状加重的个体在整体认知功能和情景记忆方面表现出最快的下降,其次是持续出现重度或中度抑郁症状的参与者。只有在抑郁症状加重的受试者中,执行功能的下降率明显高于抑郁症状持续减轻的受试者。在抑郁症状减轻的个体和抑郁症状持续减轻的个体之间,认知能力下降的比率没有显著差异。

结论:在中国中老年人群中,抑郁症状加重与认知能力下降最严重同时发生,这可能表明,在抑郁症状恶化的个体中,应优先采取旨在缓解认知能力下降的干预措施。

二、研究设计

P(Population)研究对象:参与2011-2018四轮中国健康与退休纵向研究(CHARLS)调查的人群队列数据。

O(Outcome)结局:认知能力下降。

S(Study design)研究类型:队列研究。

三、研究结果

1.人群特征

9264人平均年龄57.8±8.6岁,男性占50.3%。表1显示了每一波调查中抑郁症状、情景记忆和执行功能得分的描述性结果,以及基线协变量。

078dfcccf1bd08799bd4b48bd1e3f715.png

afe9d2757c43375ac8dd595482ed5074.png

2.抑郁症状的轨迹

逐步建立1至7类的轨迹模型序列,并对其进行比较,以确定表征研究期间抑郁症状动态变化异质性的最佳拟合模型(补充表S1)。这些过程表明,具有5个不同轨迹的模型优于具有较少轨迹的模型。虽然具有6或7个轨迹的模型与BIC和AIC的进一步改善有关,但这些模型产生的一些轨迹的隶属度<5%,平均后验概率<0.7。因此,我们选择了5组抑郁症状轨迹模型(4次立方和1次二次)(表S2)用于后续分析。为了便于解释,我们根据建模的图形模式为不同的抑郁症状轨迹分配了标签(图2):1类,持续的低抑郁症状(n = 3206, 34.6%);第2类,持续中度抑郁症状(n = 3747, 40.5%);第3类,抑郁症状加重(n = 899, 9.7%);第4类,抑郁症状减轻(n = 929, 10.0%);第5类,持续高度抑郁症状(n = 483, 5.2%)。每次就诊时抑郁症状的平均得分和临床相关抑郁症状(csd -10评分≥10)的参与者比例汇总在补充表S3中。

b03756f2a04cd3e6cf9d467c43918fc7.png

3.轨迹亚种群特征

表2显示了每个轨迹组中抑郁症状个体的基线特征。女性参与者更有可能报告抑郁症状持续升高或增加。农村地区的参与者往往表现出抑郁症状的减轻。此外,“持续高抑郁症状”轨迹组的个体往往年龄较大,独居,教育水平较低,有更多的合并症,并有听力障碍。

7acb7172aaa2f867b8c0b4c8c74bd9cd.png

2b5bfb433b72081e2288fa432f14db1b.png

4.抑郁症状、轨迹和认知能力下降的速度

在线性混合模型中,对抑郁症状轨迹和时间相互作用的估计表明,抑郁症状轨迹组的认知z分数下降的平均差异率,如表3所示。在逐步调整协变量的过程中,结果保持稳定。与参照组(持续低抑郁症状)相比,抑郁症状加重的个体在整体认知功能(β =-0.058,95% CI:-0.072至-0.045)和情景记忆(β =-0.062,95% CI:-0.077至-0.047)的z得分下降最快,其次是持续高抑郁症状的参与者(β =-0.038,95% CI:-0.056至-0.021;β =-0.051,95% CI分别为-0.070至-0.031)和持续的中度抑郁症状(β =-0.010,95% CI:-0.019至-0.002;β =-0.012,95% CI分别为-0.021至-0.003)。与抑郁症状持续较低的个体相比,抑郁症状加重的个体在执行功能z分数上的下降速度明显更快(β =- 0.029, 95% CI: -0.040至-0.017)。抑郁症状减轻的个体与抑郁症状持续减轻的良好轨迹组的个体在认知衰退率上没有显著差异。图3显示了抑郁症状轨迹与认知衰退率之间的年龄特异性和性别特异性关联。分层分析的结果与主要分析的结果基本一致。

2871126ab2ab05db086b3288d80f78ad.png

18e12a63824a9ffccbddbd656d6ed134.png

37cc14f4e40243a0d52223126e86a5e6.png

统计学方法

1.组基轨迹模型

这种方法是有限混合建模的一种特殊形式,它可以根据亚种群在一段时间内属于相似轨迹组的最大概率来区分潜在的、不可直接观察的亚种群。使用最大似然估计过程,该方法允许在模型估计中使用所有可用数据,假设丢失数据的随机性。在本研究中,重复的CESD -10评分被建模为截除正态,抑郁症状的轨迹被建立为自基线以来的年的多项式函数。

基于群的轨迹建模方法需要确定合适数量和形状的潜在轨迹。先验设置最大7个轨迹类别,并拟合1 ~ 7个轨迹类别数量逐渐增大的模型序列。我们同时评估每个轨迹的不同生长参数(线性、二次或三次),以获得描述动态抑郁症状变化的最佳多项式函数形式。比较贝叶斯信息准则(BIC)和赤池信息准则(AIC)选择最优拟合模型,绝对值越低表明模型拟合越好。将个体分配到轨迹组的平均后验概率(APP)高达70%或更高,表明分类准确。此外,为了保证后续分析的准确性,选择每个轨迹组的隶属度大于5%的模型。

203ecefea23a2a42fac5b777b7e8d5f9.png

2.线性混合效应模型

一旦确定了抑郁症状的不同轨迹,就进行卡方检验和方差分析,以探讨不同轨迹组之间个体特征的差异。为了检验抑郁症状轨迹与认知衰退率之间的关系,我们采用了分离的线性混合模型来计算整体认知功能、情景记忆和执行功能的z分数。按照推荐的程序,模型包括抑郁症状轨迹的隶属度、时间(自基线以来的年份)、时间相互作用的抑郁症状轨迹的隶属度以及上述协变量。我们从未调整的模型开始,通过逐渐加入协变量继续到多变量模型。斜率和截距均拟合为随机效应。还根据年龄和性别群体在不同的模型中进行了分层分析。

ebe83070ceb5bf452c7230ce4961040e.png

3.统计分析软件

使用SAS软件9.4版(SAS Institute, Inc)中的TRAJ插件程序,采用基于组的轨迹建模方法,生成不同访问期间抑郁症状的不同轨迹。

R语言复现

1、变量表

变量名

标签

变量类型

分类变量的编码

age

年龄

连续变量


r1mbmi

BMI

连续变量


gender

性别

2分类

0:男性; 1:女性

juzhu

居住地

2分类

0:农村; 1:城市

edu

教育程度

3分类

0:文盲; 1:小学/中学;3:高中及以上

tongju

居住状况

2分类

0:同居; 1:独居

somke

吸烟状况

3分类

0:从不吸烟者;1:目前吸烟者; 2:曾经吸烟者

drink

饮酒状况

3分类

0:从不饮酒者;1:目前饮酒者; 2:曾经饮酒者

shili

视觉障碍

2分类

0:不是; 1:是

tingli

听力障碍

2分类

0:不是; 1:是

comorbidity

合并症

3分类

0:0;1:1; 2:≥2

social

社交活动

3分类

0:0;1:1-2; 2:≥3

r1cesd10

抑郁评分

连续变量


r2cesd10

抑郁评分

连续变量


r3cesd10

抑郁评分

连续变量


r4cesd10

抑郁评分

连续变量


r1tr10

情景记忆

连续变量


r2tr10

情景记忆

连续变量


r3tr10

情景记忆

连续变量


r4tr10

情景记忆

连续变量


executive

执行能力

连续变量


executive1

执行能力

连续变量


executive2

执行能力

连续变量


executive3

执行能力

连续变量


2、安装并加载相关包,导入数据

c9607b2a815cb3165a3b4b037c0fbf47.png

3、基线特征描述

本次复现基线表格用到了tableone包,这里“myVars”汇总了基线表中的全部变量,其中有部分变量为分类变量,则需要通过“catVars”进行指定,否则分类数据也将以定量数据进行展示。

21ac947a12f40c03d7a8a310cc0bc4b6.png

这里tab2中未指定分组变量,则仅展示各变量的数据分布,此外,“showAllLevels = TRUE”表示展示分类变量所有分类因子的结果,“nonnormal =”指定的定量数据将以偏态分布进行分析,如果所有定量数据都是偏态分布,可以简洁的用“nonnormal = TRUE”来表示。

7ee2090a917cd84d2cd637e60132affc.png

最后,将基线表结果输出保存在工作空间里,这里我们设置保存为csv格式!

4、数据类型转换

de337dbfc3cd0bea96d02a0b1be0a17c.png

5、组基轨迹模型

首先,建立一个初始模型。

d8eee16628d3e2662d792d0c5d2261bf.png

其次,先验设置最大7个轨迹类别,并拟合1 ~ 7个轨迹类别数量逐渐增大的模型序列。

9e1c672371d5e3bdaea39cb357727a9b.png

找到最小的BIC值及其对应的模型,查看模型评价参数并建立模型,整合数据集。

39e01f77dbce716dbef3c8759efb6572.png

b405339741f7d54312e82c710ebe3540.png

19fc5e1b6d02c7751523a00f98bd661c.png

700abcb51e96fe84e337f267c564a7c3.png

e16fa0615eb1a8a774a4a5f87f4fe8cd.png

9bac494f90996e71bc8a09b8490fe07d.png

6、线性混合效应模型

首先,计算认知下降率,并进行因子化。

为了实现不同测试之间的可比性,生成了认知测量的z分数。在实际操作中,每次就诊时的测试分数根据基线时的初始分数进行标准化,方法是减去平均值并除以标准差(SD)。情景记忆和执行功能的z分转换分别进行。每一波的全局认知功能z分是情景记忆z分和执行功能z分的平均值,随后根据基线全局认知功能z分重新标准化。

545344dc1797a8ee804e98c39d91eb59.png

建立未调整模型,通过逐渐加入协变量继续到多变量模型。斜率和截距均拟合为随机效应。

5bec3622c9fe41d12d23dfc21841a6e4.png

计算每个时间点的平均预测值和95%置信区间。

cdaec0a4a1436e0fc0ae0355330e3129.png

本公众号回复“ 沙龙 ”即可获得  沙龙PPT,数据等资料

本公众提供各种科研服务了!

一、课程培训

2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课。如果您有需求,不妨点击查看:

发文后退款:2024-2025年科研统计课程介绍

二、数据分析服务

浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情:

课题、论文、毕业数据分析 

 临床试验设计与分析 公共数据库挖掘与统计

复现临床预测模型,需要以下步骤: 1. 数据收集和预处理:收集数据集,并对数据进行预处理,包括数据清洗、数据转换和数据缺失值处理。 2. 特征选择:选择与预测目标相关的特征变量,可以使用一些统计和机器学习方法进行特征选择。 3. 模型训练:选择合适的机器学习算法来训练模型,如逻辑回归、决策树、随机森林等。 4. 模型评估:使用交叉验证、ROC曲线等方法来评估模型的性能,选择合适的评估指标。 5. 模型优化:根据模型评估结果,对模型进行优化,如调整模型参数、改变特征选择方法等。 在R语言中,可以使用一些开源的机器学习库和工具,如caret、MLR、randomForest等,来进行临床预测模型复现。以下是一个简单的R语言示例代码: ```R library(caret) library(randomForest) # 读取数据集 data <- read.csv("clinical_data.csv") # 数据预处理 data <- data[complete.cases(data),] # 去除缺失数据 data <- data[,c("age", "sex", "BMI", "smoking", "diabetes", "hypertension", "cholesterol", "outcome")] data$sex <- as.factor(data$sex) data$smoking <- as.factor(data$smoking) data$diabetes <- as.factor(data$diabetes) data$hypertension <- as.factor(data$hypertension) data$outcome <- as.factor(data$outcome) # 特征选择 set.seed(123) ctrl <- trainControl(method = "repeatedcv", repeats = 3, summaryFunction = twoClassSummary, classProbs = TRUE) model <- train(outcome ~ ., data = data, method = "rf", trControl = ctrl, metric = "ROC") varImp(model) # 模型训练和评估 set.seed(123) ctrl <- trainControl(method = "repeatedcv", repeats = 3, summaryFunction = twoClassSummary, classProbs = TRUE) model <- train(outcome ~ ., data = data, method = "rf", trControl = ctrl, metric = "ROC") # 模型预测 test_data <- data.frame(age = 65, sex = "M", BMI = 28, smoking = "N", diabetes = "Y", hypertension = "Y", cholesterol = 200) predict(model, test_data) ``` 需要注意的是,在实践中,临床预测模型复现可能会遇到各种各样的问题,如数据质量问题、特征选择和模型选择问题等。因此,建议在实践中根据具体情况进行调整和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值