首先介绍一下影像组学:目前来讲,影像设备所生成的图像数据量越来越大,过去对图像数据的处理与使用方式显然难以充分挖掘图像的大数据信息。因此影像组学应运而生。2012年,荷兰学者Lam bin等人[1]正式提出了影像组学的概念,Radiomics即应用大量的自动化数据特征化算法将感兴趣区域(region ofinterest,ROI)的影像转换为可发掘的数据信息,并对之进行高通量 (high throughput) 定量分析。同年 Kumar等人[2]发表文章,将Radiomics的定义进一步扩展为:从CT、PET或MRI等医学影像图像中高通量地提取并分析大量高级、定量的影像学特征。
那么问题来了,影像组学究竟是什么呢。我浅薄的理解:影像组学是一门技术,应用人工智能与机器学习的方法对医学图像进行感兴趣区域(ROI)的分割,定量ROI特征提取,分析模型构建,临床辅助决策。其中提取影像组学特征是关键的一步。在这里,我将其应用到医学图像肿物的良恶性分类上。我们对感兴趣区域提取一阶、二阶(GLCM、GLDS......)以及高阶Gabor特征,但是由于多模态特征的特征维度较高,在建立机器学习的分类模型之后,导致模型的计算复杂度高、很难训练一个鲁棒性强的模型。在这里就要考虑到特征降维,例如:Lasso、Relief、MI互信息等等。在这里,我想表达的是,单个好的特征的组合并不能增加分类器的性能,换一种说法,m个最佳特征并不是最好的特征[3],因为有可能特征之间是高度相关的。在特征降维之后,我们接下来将进行数据挖掘与统计分析,从而更深层次的发掘特征数据与临床数据之间的关系。主要采用的方法就是机器学习和数据的统计分析。在这里,我们将采用机器学习