小罗碎碎念
文献主题:人工智能在
妇科肿瘤
中的最新研究进展
如下图所示,今天的六篇推文中,研究的全部都是妇科疾病,包括:
- 乳腺癌
- 宫颈癌
- 卵巢癌
- 子宫内膜癌
老板经常对我说,不要只关注自己的研究领域,其他癌种的最新研究也要关注,所以才有了这一系列推文。除了第一篇文章是去年年底发表的,其余的几篇文章都很新,所以我们从这六篇文章中就能大致摸索出一些妇科肿瘤领域的发展趋势。
第二篇文章提到,我国在2023年已经批准了一些二类和三类宫颈AI辅助分析软件,但目前仍然缺乏一个有效的宫颈癌筛查系统。乱世出英雄,在一个领域或行业急需制定规范的时候,如果你能抓住这个风口,我觉得title和money,你都会有。另外我的亲身经历告诉我,和你竞争的大部分人都和你水平差不多,因为大佬在自己的领域过的很舒服,根本没有时间也不需要冒险去开辟新的领域。那些在传统领域疯狂卷的未来大佬,也没有精力来和你竞争,因为他们大概率不想承受进入一个新领域的煎熬感。
好,点到为止,我是小罗同学,我们明天见!!
一、新型数字组织形态学生物标志物,提高侵袭性乳腺癌
预后评估的准确性
文献概述
这篇文章介绍了一种名为"Histomic Prognostic Signature"(HiPS)的新型数字组织形态学生物标志物,用于提高侵袭性乳腺癌预后评估的准确性。
以下是对文章内容的概括:
- 背景:乳腺癌是一种异质性疾病,具有不同的生存结果。传统的病理学评估依赖于定性的诺丁汉标准,但这些标准并不考虑肿瘤微环境中的非癌性元素。
- HiPS开发:研究者使用深度学习技术开发了HiPS,这是一种全面的、可解释的评分系统,用于评估乳腺癌肿瘤微环境形态学对生存风险的影响。HiPS能够量化评估细胞和组织结构,测量上皮、基质、免疫和空间交互特征。
- 研究方法:HiPS的开发基于美国癌症协会的癌症预防研究-II(CPS-II)的大规模前瞻性队列,并通过三个独立队列的数据进行了验证,包括前列腺、肺、结直肠和卵巢癌试验(PLCO)、癌症预防研究-3(CPS-3)和癌症基因组图谱(TCGA)。
- 研究结果:HiPS在预测生存结果方面一致优于病理学家的预测,且与肿瘤-淋巴结-转移(TNM)分期和相关变量无关。这一优势主要归因于对基质和免疫特征的评估。
- 结论:HiPS是一个经过稳健验证的生物标志物,可以支持病理学家的工作并改善患者的预后。
- 其他发现:HiPS的透明度和可解释性是其关键优势之一,它由对应于可识别的、已建立的生物学实体的特征组成。研究者还发现HiPS特征是高基因组不稳定性、低氧免疫微环境、肌成纤维细胞(myCAF)表型和缺乏CD8+ T淋巴细胞的亚优免疫反应的替代指标。
- 研究意义:这项研究展示了HiPS作为一种普遍适用的生物标志物的潜力,并强调了肿瘤微环境中基质和免疫特征在癌症预后中的重要性。
重点关注
Fig. 1 提供了研究方法论和使用的数据集的概述,具体内容如下:
a. 乳腺癌的临床预后指标:
- AJCC(美国癌症联合委员会)分期手册定义了三种治疗导向的亚型:
- Luminal-like(亮面型):适合接受激素治疗。
- HER2-like(HER2型):适合接受曲妥珠单抗治疗。
- TNBC(三阴性乳腺癌):不适合接受靶向治疗。
- 研究仅限于诊断时非转移性的侵袭性癌症。
- 所有样本都使用标准的IHC(免疫组化)和ISH(原位杂交)检测面板(ER、PR和HER2)以及H&E(苏木精-伊红)染色载玻片进行常规评估。
b. 确定HiPS的工作流程:
- 乳腺癌切除标本经过甲醛固定、石蜡包埋、切片、染色,并进行数字扫描。
- 使用全景分割模型识别每个载玻片的组织区域和细胞核,然后计算提取可解释的形态学特征。
- 这些特征包括诺丁汉分级中未包含的基质、免疫和空间交互特征。
- 每个生物学主题内最具预后特征,结合ER、PR和HER2,用于拟合Cox回归模型至癌症特异性生存数据。
- 最终得出的HiPS分数是组织学特征的可解释加权组合。
- 此外,研究者确定了区分三个不同预后组的阈值。
- 最后,使用临床、基因组和流行病学数据对HiPS进行了验证。
c. 使用的数据集概览:
- 研究包括了几乎美国所有地理区域的患者,覆盖48个州的614个县,加上哥伦比亚特区。
- CPS-II数据用于预后模型拟合,PLCO、TCGA和CPS-3作为独立验证队列。
- 除TCGA外,所有数据集都有预诊断风险因素暴露数据,而CPS-3除外,所有数据集都有生存结果数据。
- TCGA和PLCO样本专门来自三级医疗中心,与大多数来自非三级和社区医院的CPS数据集不同。
这个图表提供了对研究方法和使用的数据集的全面了解,展示了HiPS开发和验证的整个过程,以及所涉及的不同数据集和它们的来源。
二、人工智能宫颈癌
筛查(AICCS)系统的开发和验证研究
文献概述
这篇文章是关于一种名为人工智能宫颈癌筛查(AICCS)系统的开发和验证研究。
该系统旨在提高宫颈癌筛查的精确度,通过分析宫颈细胞学图像(WSIs)来分级和诊断宫颈癌。研究涉及16,056
名参与者,使用了两种人工智能模型:一种用于在局部层面检测细胞,另一种用于对整个切片图像进行分类。
AICCS系统在不同的数据集上展示了高准确率,包括回顾性、前瞻性和随机观察试验数据。在前瞻性评估中,AICCS达到了0.947的曲线下面积(AUC)、0.946的敏感性、0.890的特异性和0.892的准确率。特别值得注意的是,在随机观察试验中,AICCS辅助的细胞病理学家比单独的细胞病理学家有显著更高的AUC、特异性和准确率,并且敏感性提高了13.3%。
研究还指出,尽管中国在2023年批准了一些二类和三类宫颈AI辅助分析软件,但目前中国仍然缺乏一个有效的宫颈癌筛查系统。AICCS系统可能提供了一种适应中国特定条件的解决方案,尤其是在县级医院,这些地方缺乏熟练的细胞病理学家。此外,AICCS系统还可能通过5G网络和智能医疗来解决医疗资源不平衡问题,并提高医疗服务质量。
研究也提到了一些局限性,包括操作者经验有限可能导致的假阴性结果、不同医疗中心制备液基细胞学样本的技能水平差异可能导致的诊断结果准确性影响,以及在实施AI筛查系统时需要考虑的伦理问题,例如患者隐私、数据安全和医疗专业人员在决策过程中的作用。
总的来说,这项研究展示了AI辅助宫颈细胞学筛查的潜力,并表明AICCS系统在提高宫颈癌检测和临床实践方面具有显著的准确性和辅助能力,为改善医疗机构的医疗服务和部署铺平了道路。
重点关注
人工智能宫颈癌筛查(AICCS)系统的工作流程
具体分为以下几个主要步骤:
- WSI的获取与预处理(A):首先,通过使用沉降液基制备方法收集并维护的宫颈液基制备样本进行数字化,生成整个切片图像(Whole-Slide Images,WSIs)。
- 质量控制:生成的WSIs需要通过质量控制,以确保图像的质量满足后续分析的要求。
- 局部层面的细胞检测(B):通过质量控制的WSIs会进行局部层面的检测。这一步骤涉及将WSI分割成较小的区域(patches),使用滑动窗口方法对每个小区域进行分析,并根据2014年贝塞斯达系统(The Bethesda System,TBS 2014)的标准对异常细胞进行注释。
- 细胞检测模型的输出:细胞检测模型的输出将作为WSI层面分类模型的输入数据。
- WSI层面的分类(C):WSI层面的分类模型利用细胞检测模型的结果,根据TBS 2014生成可能的细胞学分级,包括ASC-US(无明确意义的鳞状上皮细胞)、LSIL(低级别鳞状上皮内病变)、ASC-H(意义不明确的高级别鳞状上皮细胞)、HSIL(高级别鳞状上皮内病变)、SCC(鳞状细胞癌)和AGC(非特定性腺体细胞异常)。
整个工作流程体现了AICCS系统如何通过结合先进的图像处理技术和人工智能算法,自动化地完成从样本数字化到最终细胞学分级的整个诊断过程。
三、可解释的多模态模型,提升卵巢癌诊断的准确性
文献概述
这篇文章是关于一种名为OvcaFinder的新型可解释模型的开发和验证,该模型整合了多模态信息,用于提高卵巢癌诊断的准确性。
卵巢癌是一种具有高度异质性的疾病,其死亡率在妇科恶性肿瘤中最高。文章指出,早期准确诊断卵巢癌对于改善治疗结果至关重要。
OvcaFinder模型结合了基于超声图像的深度学习(DL)预测、放射科医生根据卵巢-附件报告和数据系统(O-RADS)给出的评分,以及常规的临床变量。研究结果显示,OvcaFinder在内部和外部测试数据集中的表现均优于临床模型和单独的DL模型,其下曲线面积(AUC)分别达到了0.978和0.947。OvcaFinder的使用还提高了放射科医生的诊断性能和读片者之间的一致性,降低了假阳性率。
此外,OvcaFinder能够通过热图突出显示最重要的区域,并通过Shapley值揭示每个参数的影响,从而为其预测提供解释。研究还包含了对OvcaFinder的评估,包括基线信息、不同模型的性能比较、以及OvcaFinder对放射科医生诊断准确性的影响等。
研究由多个中国和香港的研究机构共同完成,强调了多模态信息整合在自动卵巢癌诊断中的必要性,并指出OvcaFinder作为一种非侵入性辅助工具,在现实世界中的使用潜力。
重点关注
OvcaFinder 模型的开发流程
该模型利用基于图像的深度学习预测、放射科医生给出的 O-RADS 分数以及临床参数进行训练,具体可以分为以下几个部分:
a. 数据获取:
这是开发任何机器学习模型的第一步,涉及到收集所有必要的数据,包括超声图像、O-RADS 分数和临床参数。这些数据将用于后续的模型训练和验证。
b. 多模态信息:
此步骤强调了整合不同类型的信息来提高模型的诊断能力。在 OvcaFinder 的情况下,这意味着将超声图像的深度学习分析结果与 O-RADS 分数和临床参数结合起来,以获得更全面的诊断视角。
c. 模型开发:
在这一步骤中,使用上述多模态信息来构建和训练 OvcaFinder 模型。这涉及到选择合适的算法(如随机森林),调整模型参数,并使用交叉验证等技术来评估模型的性能。
d. OvcaFinder 的全局和局部解释:
这一步骤涉及到模型的可解释性,即理解模型是如何做出特定预测的。全局解释可能涉及分析所有样本的模型预测,以确定哪些特征对模型的诊断决策最为重要。局部解释则关注个别样本,使用技术如热图(heatmaps)和 Shapley 值来显示每个特征对最终预测的具体贡献。
O-RADS(卵巢-附件报告和数据系统)是一个标准化的术语系统,用于描述附件病变并提供风险分类和相应的管理策略。在 OvcaFinder 中,O-RADS 分数是作为输入特征之一,有助于提高模型的诊断准确性。
整个 Fig. 5 描述的流程强调了从数据收集到模型开发,再到模型解释的端到端过程,这对于确保 OvcaFinder 模型不仅在技术上有效,而且能够被医疗专业人员理解和信任是至关重要的。
四、基于组织病理学图像的深度学习分类器,预测高级别浆液性卵巢癌
(HGSOC)患者对铂基化疗的反应
文献概述
这篇文章是关于一种新型的基于组织病理学图像的深度学习分类器(Pathologic Risk Classifier for High-Grade Serous Ovarian Cancer, PathoRiCH),该分类器可以预测高级别浆液性卵巢癌(HGSOC)患者对铂基化疗的反应。
以下是文章的主要内容概括:
-
研究背景:HGSOC是最常见的妇科恶性肿瘤之一,铂基化疗是其标准治疗方案。然而,目前缺乏能够快速预测患者对铂基化疗反应的生物标志物。
-
PathoRiCH开发:研究者开发了PathoRiCH,这是一个基于组织病理图像的分类器,旨在预测HGSOC患者对铂基治疗的反应。该分类器在内部队列(394名患者)上进行了训练,并在两个独立的外部队列(分别为284名和136名患者)上进行了验证。
-
研究结果:PathoRiCH预测的对治疗有利和不利的组在所有三个队列中显示出显著不同的无铂间期(platinum-free intervals, PFIs)。结合PathoRiCH和分子生物标志物可以提供更强大的患者风险分层工具。
-
模型解释:PathoRiCH的决策通过可视化和转录组分析得到解释,增强了模型决策的可靠性。并且,PathoRiCH显示出比当前分子生物标志物更好的预测性能。
-
临床意义:PathoRiCH为开发创新工具提供了坚实的基础,这些工具可能改变目前HGSOC的诊断流程。
-
研究方法:研究使用了多种多实例学习(MIL)模型,这些模型仅使用组织病理图像来预测女性HGSOC患者对铂基治疗的反应。研究还涉及了对模型输出的可视化分析和预测组的分子特征分析。
-
结论:PathoRiCH是一个有前景的新工具,可以作为临床实践中初始病理诊断的一部分,为HGSOC患者的风险分层提供信息。
-
研究限制:尽管PathoRiCH在预测HGSOC患者的PFI方面显示出统计学上的显著性能,但模型在外部验证队列中的AUC-ROC值接近0.6,表明模型在仅使用组织学图像进行HGSOC分类方面存在挑战。
-
未来方向:为了确立模型的稳健性并引入临床实践,需要进行额外的多中心验证和对模型的深入解释。
文章强调了PathoRiCH作为一个新的诊断工具的潜力,并指出了其在临床应用中的前景和需要进一步研究的领域。
重点关注
多实例学习(MIL)模型的概述
以下是对图中描述的MIL模型的分析:
-
图像块提取:从全切片图像(WSIs)中提取不同放大倍数(5×和20×)的图像块。这些图像块代表了组织的不同区域,其中5×提供了更宏观的视图,而20×则提供了更详细的细胞级别视图。
-
自动化癌症分割:图像块经过自动化癌症分割处理,以排除那些不含癌细胞的图像块。这一步骤是为了确保接下来的分析集中于可能包含预测治疗反应相关信息的癌症区域。
-
对比自监督学习算法:经过癌症分割的图像块被输入到一个对比自监督学习算法中(图中蓝色箭头路径)。这种算法可以帮助模型学习图像的特征表示,而无需依赖于外部的标注信息。
-
全组织分析:作为另一种选择,所有图像块,包括不含癌细胞的图像块,也可以直接输入到自监督学习算法中,以包含WSIs中的所有组织(图中红色箭头路径)。这种方法可能会捕获到癌症微环境或周围组织的特征,这些特征可能与癌症行为有关。
-
多实例学习方法:对于单一尺度和多尺度放大设置(5×、20×以及两者结合),分别使用了不同的MIL方法。这导致了生成了六种不同的MIL模型。
-
多尺度MIL模型:在多尺度MIL模型中,通过将不同尺度的WSIs的嵌入(embeddings)串联起来形成特征金字塔,这些特征金字塔被用来训练MIL聚合器。这种方法可以整合不同尺度的信息,可能有助于模型更全面地理解图像内容。
-
模型输出:这些MIL模型的输出将用于预测HGSOC患者对铂基化疗的反应。模型的训练和验证使用了不同的数据集,以确保其预测能力的泛化性和准确性。
总的来说,图1展示了一个复杂的深度学习框架,它结合了多尺度图像分析和自监督学习技术,以预测癌症治疗的反应。通过这种方法,研究者能够利用组织病理图像中的微观和宏观特征来提高对癌症治疗反应的预测能力。
五、多模态深度学习预测模型,预测子宫内膜癌
(EC)患者的远处复发风险
文献概述
研究团队开发了一个名为HECTOR(histopathology-based endometrial cancer tailored outcome risk)的多模态深度学习预测模型,用于预测子宫内膜癌(EC)患者的远处复发风险。
HECTOR模型利用了苏木精-伊红染色的全切片图像(whole-slide images, WSI)和肿瘤分期作为输入,对来自八个EC队列的2,072名
患者进行了训练和测试,包括PORTEC-1/-2/-3随机试验。
HECTOR模型在内部测试集(353名患者)和两个外部测试集(分别为160名和151名患者)上展示了出色的预测性能,C指数分别为0.789、0.828和0.815,超过了当前的金标准。此外,HECTOR还通过Kaplan-Meier分析识别出了具有显著不同预后的患者群体,10年远处复发无病生存概率分别为97.0%、77.7%和58.1%。HECTOR模型还预测了辅助化疗的益处,优于现有方法。
研究还通过形态学和基因组特征提取,识别了与HECTOR风险组相关的因素,其中一些具有治疗潜力。HECTOR模型通过改善当前的金标准,可能有助于在EC治疗中实现个性化医疗。
文章还讨论了HECTOR模型的设计和性能,包括自监督学习、多模态三臂架构、特征提取和风险预测等。此外,还探讨了HECTOR模型与现有预测模型的比较、与临床病理学和分子风险因素的关联分析、以及对辅助治疗反应的预测能力。
最后,文章强调了HECTOR模型的潜力,认为它可能成为一个高效的工具,用于个性化预测EC女性的远处复发风险,并可能指导临床医生对患者进行更精确的治疗决策。研究团队计划在前瞻性临床试验中进一步验证HECTOR模型的性能。
重点关注
HECTOR模型的概述,分为两个主要部分:
a部分
描述了组织从子宫内膜癌(EC)的苏木精-伊红(H&E)染色全切片图像(WSI)中的分割过程,随后这些组织被划分成180微米大小的区域(称为patches)。
使用一个多阶段的视觉变换器(vision transformer),通过自监督学习的方法,从1862名患者
的WSI中随机抽取区域进行训练,这些患者不包括在内外部测试集中。在变换器的最后八个区块中提取了区域级别的特征。
b部分
展示了HECTOR模型如何接收H&E WSI和根据FIGO 2009标准分类的解剖学分期(I至III期)作为输入。提取的区域级别特征在空间和语义上进行了平均处理。这些特征随后被输入到一个基于注意力机制的多重实例学习模型和im4MEC深度学习模型中(所有层都是冻结的),后者能够从H&E WSI预测分子类别,如imPOLEmut、imMMRd、imNSMP或imp53abn。
解剖学分期和基于图像的分子类别都通过嵌入层(Embedding layers)进行处理。在得到的三个嵌入上应用了基于门控的注意力机制(gating-based attention),然后通过克罗内克积(Kronecker product)进行融合。使用负对数似然损失函数(-log(likelihood loss))来预测在离散时间上的无远处复发概率函数。风险评分被定义为综合预测概率。
在这段描述中,还提到了一些深度学习组件和概念:
- 多重实例学习(Multiple Instance Learning, MIL):一种学习设置,其中每个实例组(在这种情况下是WSI中的patches)可以包含多个实例,目标是预测整个组的标签。
- im4MEC:一种深度学习模型,用于从H&E染色的WSI预测EC的分子类别。
- 门控注意力(Gating-based Attention):一种注意力机制,可以控制不同特征嵌入的相对重要性。
- 克罗内克积(Kronecker Product):一种数学运算,用于合并多个特征嵌入。
- 负对数似然损失(Negative Log-Likelihood Loss):一种常用于分类和预测任务的损失函数。
- 多层感知器(Multilayer Perceptron, MLP) 和 全连接层(Fully Connected Layer, FC):深度学习中用于特征转换和决策的网络层。
整体来看,HECTOR模型结合了多种深度学习技术和多模态数据,以预测子宫内膜癌患者的远处复发风险。
六、年龄对子宫内膜癌
女性患者肿瘤学结果的预后影响和因果关系
文献概述
这篇文章是一项多方法分析研究,探讨了年龄对子宫内膜癌女性患者肿瘤学结果的预后影响和因果关系。
研究使用了三个大型随机试验(PORTEC-1、PORTEC-2和PORTEC-3)的数据集,共纳入了1801名
妇女。
研究发现,随着年龄的增长,总体复发率和子宫内膜癌特异性死亡率显著增加。老年女性更常见深层肌层浸润、浆液性肿瘤组织学类型和p53异常肿瘤。研究使用先进的统计和因果推断技术,包括一种名为AutoCI
的深度学习因果推断模型,确定年龄是一个独立的预后风险因素,并且是导致肿瘤学结果恶化的显著因果变量。
研究的解释是,老年女性的肿瘤特征更具侵袭性,并且与较差的肿瘤学结果独立且有因果关系。因此,研究建议,仅根据年龄不应排除老年女性进行诊断评估、分子检测和辅助治疗。研究没有接受任何资助,版权归Elsevier Ltd所有。
研究背景指出,子宫内膜癌是全球女性第六大常见癌症,其发病率正在上升,这部分是由于人口老龄化,因为子宫内膜癌主要是绝经后女性的疾病。研究还讨论了老年女性治疗可能存在的偏差,如较少接受强化治疗,以及可能的更侵袭性的肿瘤特征。研究强调了需要进行全面分析,以确定年龄是否是复发和癌症相关死亡的独立风险因素。
此外,研究还探讨了如何将年龄与肿瘤特征和肿瘤学结果的关联转化为临床实践,并提出了未来研究方向,包括探究生物学年龄与不良结果之间的关系,以及免疫系统和抗肿瘤反应如何影响老年女性的预后。
研究的结论是,老年女性的肿瘤学结果较差,这一部分可以用更具有侵袭性的组织病理学和分子肿瘤特征来解释,但年龄的独立和因果负面影响仍然未被解释清楚。
重点关注
按年龄组划分的总体复发率和子宫内膜癌特异性死亡率的累积发生率。
这个图表由两部分组成:
(A) 总体复发的累积发生率按年龄组划分:
这部分图表显示了不同年龄组的患者随着时间的推移,累积复发率的变化。从图表中可以看出,随着年龄的增长,总体复发的风险也在增加。特别是在60岁以下的年龄组与60岁至70岁以及70岁以上的年龄组相比,复发率的差异更加显著。
(B) 子宫内膜癌特异性死亡的累积发生率按年龄组划分:
这部分图表显示了不同年龄组的患者随着时间的推移,因子宫内膜癌导致的死亡累积发生率。与总体复发的情况相似,这部分图表也显示了随着年龄的增长,因子宫内膜癌死亡的风险也在增加,特别是在60岁以下的年龄组与其他年龄组相比,风险增加更为明显。
这两个图表的累积发生率曲线反映了年龄对子宫内膜癌预后的显著影响。曲线的斜率表明,随着年龄的增长,复发和死亡的风险逐渐增加,这与研究的主要发现一致,即年龄是一个独立的预后风险因素,并且与更差的肿瘤学结果有因果关系。这些数据支持了研究的结论,即老年女性不应仅基于年龄就被排除在诊断评估、分子检测和辅助治疗之外。