论文阅读:肺癌

一. Introuction

1.早期肺癌在影像的呈现形式是各种类型肺结节

(1)实性结节(边缘线条明显、呈现比较规则形态、内部紧凑)

(2)非实性结节(边缘线条不明显、呈现不规则形态),其中磨玻璃结节(GGN)难以诊断分割。

(3)亚实性结节(边缘线条不太清晰、形状不太规则)

肺结节分割方法:

基于阈值的分割:目标区域与背景区域灰度级相差较大的图像

基于区域增长算法

基于聚类算法

基于超像素分割算法

2.除了对肺结节辅助分割,还需精确对肺癌进行亚型鉴定。

1.肺癌分类 

(1)非小细胞性肺癌(NSCLC)约占80%-85%:它们对化疗和放疗的敏感性低,靶向药物治疗的疗效取决于病理诊断的癌症分期,因此通过识别基因突变可能提高患者的生活质量和预后。

肺腺癌LUAD

肺鳞癌LUSC

大细胞癌LCC

(2)小细胞性肺癌(SCLC)约占15%-20%:​​​​​​​它是一种恶性肿瘤,但对其化疗和放疗很有效。

2.相关背景介绍

肺癌是一种高发病率和高死亡率的癌症,与多种基因突变有关。个体化靶向药物治疗已成为肺癌的最佳治疗方法,尤其对不符合肺切除术条件的患者有利。从染色病理切片中准确识别肿瘤区域内的突变基因至关重要。因此,我们主要致力于通过分析病理图像来识别肺癌的突变基因。

肉眼检查病理染色切片仍然被认为是诊断肿瘤的“黄金方法”。但是,诊断准确率和治疗计划通常基于活检研究的结果。它需要经验丰富的病理学家,他们能够通过目视检查病理图像来确定肺癌细胞形态的变化和相应的肿瘤分期。目前,病理学家可以通过在显微镜下观察染色切片来确定肿瘤的组织学分期。

“靶向治疗”是应用先进的技术,将药物精确地输送到肿瘤区域,以便在不损害正常组织细胞的情况下,特异性地消除恶性细胞。

本文旨在根据肺癌的卷积神经网络,开发一种新的算法来预测突变基因,这些突变基因是潜在的靶向药物治疗候选基因。在本研究中,我们使用从TCGA下载的苏木精-伊红(H&E)染色的肺癌病理切片,从而使用深卷积高斯混合模型DCGMM进行颜色归一化。训练数据采用卷积神经网络(CNN)和残差网络(Res-Net)。通过该模型获得肺癌生物标志物的平均概率,其最高准确率达到86.3%。它提供了一种基于肺癌突变基因开发有效靶向治疗的方法,然而,在应用于临床实践之前,还需要进一步的研究来评估设计模型的有效性和可靠性。

3.实验流程

​​​​​​​ 

a)从CancerGenome Atlas数据库下载图像

b)识别肿瘤区域:使用DeepIMLH在H&e染色切片上注释肺癌的肿瘤区域

图2A所示:从TCGA下载图像。

图2B所示:(专业病理学家注释的肿瘤区域)中蓝黄色圆圈包围的区域是肿瘤区域的边界。

图2C所示:(带512*512滑动窗口的分段WSI)在CNN模型训练之前,用512*512像素窗口将完整的幻灯片图像分成大小相同的小块。

图2D所示:(块降噪处理)为了减少后续训练中的显著干扰,我们去除背景噪声、空白或较大的模糊区域。Python的OpenCV用于计算瓷砖的模糊背景面积与切片总面积的比率。设置阈值是为了去除小于阈值的样本。Python的OpenCV软件包也被用来分割H&E染色切片。

最后,它被整合到新的数据集中,并按照1:1的比例分解为一个训练集和一个验证集

 c)颜色标准化

采用无监督的深卷积高斯混合模型()来标准化H&E染色切片的颜色。为了评估DCGMM训练的效率,这些图像在训练后应该具有一致的颜色和不变的特征,如形态、像素和结构。颜色标准化主要是基于高斯分布对原始图像进行平均,然后将原始图像转换为白色和彩色。图3是H&E染色切片颜色标准化的框架图。图3中的上三幅图像是未经颜色标准化的原始图像,下三幅图像是经过颜色标准化的图像。将原始图像与目标图像进行比较,我们可以发现该模型只对图像的颜色进行了归一化,而不改变图像的大小、像素和位置。此外,该模型是无监督的,它不需要任何数据假设或任何标签。

 

d)生物标记识别

输入:将处理后的肺癌H&E染色切片和生物标记物输入到深卷积神经网络的输入层

输出:这里的输出是具有靶向治疗不同肺癌生物标记物特征的slides。

e)热图

首先用512*512个肺癌生物标志物切片窗口扫描了完整的图像。然后通过CNN+Res网络模型,应用滑动窗口的像素,得到每张slide的结果。

将所有通过像素的值相加并计算其平均值,作为肺癌靶向治疗的生物标记物概率。

我们使用概率可视化将像素素靶向治疗标记物的概率转换为颜色值。概率值在(0,1)到RGB颜色的范围内从纯蓝色(0,0,255)线性映射到纯红色(255,0,0)。

因此,热图中的红色表示生物标记出现的概率较高,蓝色表示生物标记出现的概率较低。WSI有多个分片,每个分片都可以通过模型预测相应的结果概率。我们整合了所有分片的结果通过融合算法得到对应WSI的最终概率结果。定义前n个窗口的平均概率作为识别分数。通过设定临界阈值预测肺癌生物标记物的发生概率。其中,高于阈值的被认为是积极的,否则被认为是消极的。我们使用最高值作为超参数,并通过交叉验证确定。通过使用scikit learn中的网格搜索CV类提供超参数字典来确定模型的超参数。

本研究中肺癌生物标记物的AUC值是肺癌H&E染色全层图像上每个生物标记物的平均概率。

以假阳性率(FPR)为X轴,真阳性率(TPR)为Y轴绘制THROC图。ROC曲线下的面积为AUC值。

由于精确度较高,此处仅显示MET、FGFR1、FGFR2和HRA生物标记的ROC曲线。这些标记物可能对预测靶向治疗的敏感性和疾病预后有影响。

 

 

 

 

 (A) (B)代表小细胞肺癌(C)和(D)代表鳞状细胞肺癌和腺样细胞肺癌。

Dice系数

 

癌症亚型分类的传统方法:利用不同类型的基因数据或影像信息构建分类模型

癌症亚型分类的机器学习方法:随机森林、决策树、支持向量机

探索基因表达数据以外的其他基因数据在亚型分类中的应用

3..肺癌分期

 利用多组学基因数据对肺癌分期

4.肺癌影像预测基因突变

二.主要工作

数据集:DNA甲基化

数据集特征选择:套索回归

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值