NHANES挖掘培训班来啦,就在4.20-21!
郑老师团队2024年NHANES公共数据库挖掘培训班,由浅入深,零基础可学,欢迎报名!
2024年3月28日,四川大学华西医院学者用SEER数据库2000年至2019年的数据做了一项队列研究,在《International Journal of Surgery》(医学二区,IF=15.3)发表了一篇题为:“Clinicopathologic characteristics and outcomes of prostate cancer incidentally discovered at the time of radical cystoprostatectomy: a population-based cohort study”的研究论文,统计方法简单,我们一起看看!
研究者回顾已发表的关于并发BCa和PCa的临床意义的文献,发现数据不同且相互矛盾,前列腺癌可能对患者生存结果产生不利影响的具体不良特征尚不清楚。本文旨在利用具有全国代表性的监测、流行病学和最终结果(SEER)数据,描述接受根治性膀胱前列腺切除术(RCP)的膀胱癌(BCa)患者并发前列腺癌(PCa)的发病率和临床病理特征。此外,试图确定合并BCa和PCa患者的危险因素和肿瘤预后。
主要研究结果
1.研究设计
研究者SEER数据库中检索并收集了2000年至2019年期间接受RCP的BCa患者的数据。
P(Population)参与者:根据纳入和排除标准,SEER数据库中共有14199例BCa患者符合纳入标准。
E(exposure)暴露:所有患者分为两组:仅BCa组(n = 10,103)和BCa和PCa合并组(n=4,096)(经rcp后标本病理检查诊断为BCa和PCa的患者认为同时存在BCa和PCa)
O(outcome)结局:癌症特异性生存(CSS)。
S(Study design)研究类型:队列研究
2.Logistic回归确定危险因素
利用单因素和多因素logistic回归模型,研究者评估了与BCa和PCa同时发生相关的危险因素。
在单因素分析中,如初始诊断年龄(P < 0.001)、种族(P < 0.05)、诊断年份(P < 0.001)、肿瘤分期(P < 0.001)、BCa的组织学类型、病理分级与BCa和PCa同时发生有显著相关性。
进一步的多因素分析显示高龄(> 65岁vs≤65岁,OR 1.65;95% CI 1.53-1.78)、诊断年份(P < 0.001)和高肿瘤分级(OR 1.30, 95% CI 1.07-1.58)与BCa和PCa同时发生的风险升高显著相关。
相反,非白种人:API (OR 0.64, 95% CI 0.53-0.77)和AI/Unknown (OR 0.57, 95% CI 0.34-0.95)与BCa和PCa同时发生的风险降低显著相关。
3.倾向性得分匹配PSM
为了评估同时发生BCa和PCa的临床意义,我们进行了PSM分析,以减轻潜在的混杂因素和选择偏倚。同时诊断为PCa和完整PSA信息的患者与仅诊断为BCa的患者的匹配比例为1:3。
通过PSM分析减少潜在偏倚后,两组的变量是均衡可比的。然而,与单纯BCa患者相比,合并肿瘤的患者中白人比例仍然较高(91.5% vs. 88.6%, P = 0.014)。
评估匹配队列中的协变量均衡性是评估匹配样本质量的关键步骤。标准化平均差分析表明,除了种族(10.5%)外,几乎所有协变量都低于10%,表明匹配令人满意。
此外,匹配前后的倾向得分分布显示,匹配后,两组倾向得分分布变得更加均匀,表明两个队列之间的可比性得到了提高。
4.生存分析
生存分析显示,单独诊断为BCa的患者与合并诊断为PCa的患者的CSS无显著差异(5年CSS率:71.3% vs. 67.2%,P = 0.076)
亚组分析显示,诊断为BCa合并高危PCa的患者生存率较差(5年CSS率:71.3% vs. 63.4%,调整P=0.085)。
根据欧洲泌尿外科协会(EAU)对局限性PCa的风险分层指南,根据肿瘤分期、Gleason评分和PSA值,将并发PCa患者进一步分为低/中危PCa和高危PCa。
低/中危PCa的特征为PSA < 20 ng/mL, T1-2b, Gleason评分6-7,阴性淋巴结分期(no)。
高危PCa的定义是基于不利特征,包括PSA > 20 ng/mL, T2c-4, Gleason评分> 7,和/或淋巴结受累。
在倾向性得分匹配队列中,调整年龄、种族、诊断年份、分期、肿瘤分级和组织学的多变量COX回归分析中,合并高风险PCa与癌症特异性死亡率的风险相关(HR 1.27, 95% CI 1.01-1.58, P = 0.038)。
然而,同时存在低/中危PCa并不会增加BCa患者的死亡风险(调整P = 1.000,图2;在多变量分析中:HR 1.07, 95% CI 0.84-1.36, P = 0.584)。
统计学方法
1.Logistic回归探讨危险因素
利用单变量和多变量Logistic回归模型确定与并发BCa和PCa相关的危险因素,并以比值比(OR)和精确的95%置信区间(CI)显示结果。
2.倾向性得分匹配控制混杂
为了减少潜在的基线混杂因素,进行了倾向评分匹配(PSM)分析。研究者将基线不均衡变量纳入匹配,匹配的平衡变量包括患者年龄、种族、诊断年份、肿瘤分期、病理分级和BCa的组织学类型。
使用R Studio中的“Matchit”包进行队列间倾向评分匹配。该过程使用近邻配比法,匹配比例为1:3,卡钳值设置为0.02。
为了评估匹配前后协变量的平衡,我们使用了R Studio中的“Cobalt”包。协变量平衡通过分析均数的标准化差来评估,均数差的绝对值小于0.1被认为是匹配成功的标志。
3.匹配后做生存分析
利用Kaplan-Meier生存曲线,对单独诊断为BCa的患者和同时诊断为BCa和PCa的患者进行PSM后CSS的估计和比较分析。
在三组生存分析中进行2×2比较时,采用Bonferroni校正来调整P值,降低了I型错误的风险。
采用多变量Cox回归分析模型评估BCa和PCa同时使用对生存率的影响。
后记
SEER数据库越来越不好发了,但,本文研究者用SEER数据发表了15.3分的二区期刊,通篇的研究思路很清晰,对统计学方法的描述很顺畅,也比较详细。
研究者先开展单因素和多因素的Logistic回归确定危险因素;然后为了评估同时发生BCa和PCa的临床意义,进行了倾向性得分匹配,将基线有差异的变量纳入PSM,匹配比例为1:3,控制混杂因素;而后开展生存分析,绘制KM曲线,并做多变量COX回归。
本文用到的方法并不难,郑老师专门录制了倾向性得分匹配的课程,包括倾向性得分匹配的方法及SPSS、R语言实操,代码给你,改一下就可以做你自己的研究,有兴趣的研友不妨看看!
本公众提供各种科研服务了!
一、课程培训 2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课。如果您有需求,不妨点击查看: 二、数据分析服务 浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情: |