Nhanes美国营养调查数据库的培训课程来了!
“Nhanes数据挖掘”课程即将开始! 欢迎报名, 发表文章即退款
2017年4月10日,中国学者在《J Clin Oncol》(一区,IF=45.3)发表题为:" Impact of Examined Lymph Node Count on Precise Staging and Long-Term Survival of Resected Non-Small-Cell Lung Cancer: A Population Study of the US SEER Database and a Chinese Multi-Institutional Registry" 的研究论文。
我们使用中国多机构登记处和美国SEER数据库中关于I至IIIA期切除的NSCLC(2001年至2008年)的数据研究了非小细胞癌症(NSCLC)中检查的淋巴结(ELN)数量与正确分期和长期存活率之间的相关性,并确定了ELN计数的最小阈值。 结果表明,ELN数量越多与更准确的淋巴结分期和更好的切除NSCLC长期生存率有关。我们建议16个ELN作为评估淋巴结阴性患者术后LN检查质量或预后分层的切入点。
摘要与主要结果
一、摘要
目的:我们使用大型数据库研究了非小细胞癌症(NSCLC)中检查的淋巴结(ELN)数量与正确分期和长期存活率之间的相关性,并确定了ELN计数的最小阈值。
方法:使用多变量模型分析了中国多机构登记处和美国SEER数据库中关于I至IIIA期切除的NSCLC(2001年至2008年)的数据,以了解ELN计数与分期迁移和总生存率(OS)之间的关系。用LOWESS平滑器拟合平均阳性LNs、比值比(OR)和危险比(HR)系列,并通过Chow检验确定结构断裂点。所选的切入点在SEER 2009队列中进行了验证。
结果:尽管ELN计数的分布在中国注册中心(n=5706)和SEER数据库(n=38806;中位数分别为15和7)之间存在差异,两组患者均表现出从N0到N1和N2疾病的显著比例增加(SEER OR,1.038;中国OR,1.012;两者均P<0.001),OS的一系列改善(N0疾病:SEER HR,0.986;中国HR,0.981;两者P<0.001;N1和N2病:SEER HR ,0.989;中国HR ,0.984;两者均为P<0.001),因为在控制混杂因素后ELN计数增加。分界点分析显示,在申报淋巴结阴性疾病的患者中,阈值ELN计数为16,在衍生队列中进行了检查(SEER 2001至2008 HR,0.830;中国HR,0.738),并在SEER 2009队列中进行验证(HR,0.837)。
结论:ELN数量越多与更准确的淋巴结分期和更好的切除NSCLC长期生存率有关。我们建议16个ELN作为评估淋巴结阴性患者术后LN检查质量或预后分层的切入点。
二、研究结果
1.患者特征及ELN数的分布
本研究共纳入38806名符合资格标准的美国SEER队列患者和5705名符合资格条件的中国队列患者。每个队列的基线特征列于Table 1中。在中国队列3.6年的中位随访期间,记录了1897例死亡(经审查,66.7%),在SEER队列5.0年的中中位随访中,记录了17029例死亡(经过审查,56.1%)。ELN数的分布(图1)在队列之间不同;中国队列的ELN数量(中位数,15;四分位间距,10-22)大于SEER队列(中位数,7;四分位数间距,4-12)。检索2009年SEER数据库中合格病例的独立队列,以及2009年至2011年间广州医科大学附属第一医院的另一个队列,以验证切入点(Table 1)。
2.检查的LNs数量和人口阶段迁移
在两个队列中,平均ELN在T分期、N分期、组织学、肿瘤位置和手术类型的子类别中存在显著差异(数据未显示)。所有这些因素都包含在回归模型中。两个队列的N分期(从N0到N1和N2)均呈显著的比例增加,在调整组织学、T分期、肿瘤位置和手术类型后,ELN计数增加(SEER:OR,1.038;95%CI,1.035-1.041;P<0.001;中国:OR,1.012;95%CI 1.006-0.019;P<0.001;表2)。关于检查的淋巴结和确定的阳性淋巴结之间的相关性,ELN计数越高,阳性淋巴结数量越多(线性回归,R2=0.917;P<0.001),尤其是在淋巴结阳性疾病患者中(R2=0.915;P<0.001)。
SEER队列也用于估计阳性LNs数量的经验分布;然后使用这些结果来计算具有比观察到的更多正节点的概率(附录表A1,仅在线)。特别注意被认为患有淋巴结阴性疾病的患者中至少有一个或多个未被发现的阳性淋巴结的概率。正如预期的那样,ELN数量越多,阶段迁移的概率越低。
3.ELN的数量和OS
在控制了其他预后因素(性别、年龄、病理、T分期和手术类型)后,在淋巴结阴性(N0)疾病患者(SEER:HR,0.986;95%CI,0.983至0.989;P<0.001;中国:HR,0.981;95%CI:0.972至0.989,P<0.001)和淋巴结阳性(N1和N2)疾病患者中(SEER:HR,0.989;95%CI,0.986至0.992;P<0.001;中国:HR,0.984;95%CI:0.977至0.990;P<0.001),死亡风险也有类似的降低(表2)。值得注意的是,在淋巴结阳性疾病患者中,将阳性淋巴结的数量添加到Cox比例风险回归模型中后,ELN计数仍然显著(SEER:HR,0.978;95%CI,0.975至0.982;P<0.001;中国:HR,0.984;95%CI,0.977至0.990;P<0.001)。N2型患者的趋势一致(SEER: HR, 0.993;95% CI, 0.989 至 0.997;P = 0.002;中国:HR, 0.985;95% CI, 0.977 至 0.993;P < 0.001)。
4.组织学亚组的相互作用测试
通过包括组织学亚组值和ELN计数的乘积,我们测试了不同组织学类型之间的亚组差异。在包括阶段迁移和OS的两个回归模型中,未检测到显著的亚组差异(表2)。此外,当支气管肺泡癌(一种在数据收集期间用于NSCLC病理分类的实体)和大细胞癌(被认为受ELN计数影响较小)被归为一类时,在中国登记的淋巴结阴性疾病患者中,除OS外,该组合类别与由其余组织学类型组成的组合类别之间没有发现亚组差异。这些结果不支持基于组织学的ELN和OS相关性的单独研究。
5.淋巴结阴性疾病患者的切点分析及验证
图2为淋巴结阴性疾病分期迁移OR和OS HR的拟合曲线和相应的结构断点。还确定了淋巴结阴性疾病患者具有阳性淋巴结的估计概率的结构断点,以及在每个ELN计数中确定的平均阳性淋巴结(附录图A1,仅在线)。
所有的断点基本上都是一致的(从12到18不等)。因为生存是最重要的问题,我们选择了生存的结构性断裂点作为切入点。对于可推广性和代表性,我们使用了16个ELN的截止值,这些ELN是从SEER数据库生成的。
该切入点首先在中国人和SEER人群中进行了研究。生存分析证实,在对其他预后因素进行调整后,至少有16个淋巴结阴性非小细胞肺癌患者的全因死亡率显著降低(SEER 2001至2008:HR,0.830;95%CI,0.779至0.885;P<0.001;中国注册:HR,0.738;95%CI,0.655至0.831;P<0.001)。然后,在独立的SEER 2009队列中验证切入点(HR,0.837;95%CI,0.704至0.994;P=0.043)。我们的单一中心(广州医科大学第一附属医院,2009年至2011年)也进行了另一项独立验证,该验证使用无病生存率作为衡量标准(HR,0.681;95%CI为0.435至1.066;P=0.093;附录图A2,仅在线)。
设计与统计学方法
一、研究设计
P(Population)参与者:中国多机构登记处和美国SEER数据库中关于I至IIIA期切除的NSCLC(2001年至2008年)的数据
E(exposure)暴露因素:ELN计数与分期迁移。
O(outcome)结局:中国多机构登记处和美国SEER数据库中关于I至IIIA期切除的NSCLC(2001年至2008年)的总生存率(OS)。
S(Study design)研究类型:队列研究。
二、统计方法
1.多变量回归分析。我们使用x2检验来比较分类变量之间和t检验来比较连续变量之间的差异。Cox比例风险回归模型用于确定ELN数对OS的影响,并可视化生存曲线,这些曲线根据其他重要的预后因素进行了调整。基于这样的假设,即更多的ELN提供了更大的机会来识别正的LNs,在调整了手术前或手术中与ELN数或淋巴结分期相关的其他潜在混杂因素后,通过使用二元逻辑回归模型将ELN数与每个淋巴结分期类别的比例(淋巴结阴性与淋巴结阳性)相关联来评估分期迁移。所有计算均使用SPSS 17.0版Windows软件(IBM Corporation,Chicago,IL)进行。
2.所涉及的LNs数量的准确性。根据Iyer等人之前描述的程序,通过使用超几何分布和贝叶斯定理创建了检查节点数量的数学模型。所得模型用于估计报告的正节点数量的准确性,特别是,在具有不同观察到的采样数的淋巴结阴性疾病患者中具有至少一个未检测到的阳性LN的概率
3.曲线拟合和结构断裂点的确定。与一个ELN(作为参考)相比,每个ELN计数的优势比(OR;阶段迁移)和危险比(HR;OS)曲线,以及未检测到的阳性LNs的平均正数和概率曲线,通过使用R版本3.2.2软件,使用带宽为2/3(默认值)的LOWESS平滑器进行拟合。然后使用SAS 9.3软件(SAS Institute,Cary,NC)通过Chow检验确定结构断裂点。这些断裂点被认为是临床影响的阈值。P<0.05被认为具有统计学意义。
最后,欢迎报名郑老师团队的统计学9.2-9.3的Nhanes数据挖掘课程