在数字乳腺X照片中基于小波分析和统计分析的微钙化检测新特征

摘要:计算机辅助诊断(CAD)系统在乳腺癌的早期诊断中具有重要作用。在本文中,基于对微钙化检测的新特征集,提出了一套CAD系统。新特征是受几个对一些经典特征(高阶统计特征HOS、离散小波变换DWT和小波分解WPD)的统计观察启发。该研究采用了DWT来做预处理,学生T检验来评价和特征筛选。采用线性SVM和RBF核 。对MIAS和DDSM数据集分别使用了RBF核,该系统获得98.43%,96.74的sensitvity,93.34%,94.87%的specificity和95.8%,95.78%的accuracy。

一、introduction

乳腺癌是导致女性乳腺癌死亡的主要因素之一。然而,由于筛查性乳房x线照相术是早期发现乳腺癌[2]最可靠的方法,因此在近几十年生存率有所提高。事实上,一些迹象表明乳腺癌的存在,如微钙化,在乳房x线照片中表现为非常小的物体,这增加了放射科医生做出错误决定的可能性。因此,应利用CAD系统辅助放射科医生提高检测精度。

为了提高用于微钙化检测的CAD系统的准确性,一些研究对预处理算法进行了修改,而另一些研究则侧重于呈现与微钙化图像中包含的信息更相关的新特征。近几十年来,小波分析在微钙化增强和检测中得到了广泛的应用。由Heinlein等人提出的[3]算法改进了传统小波增强方法的性能,利用小波变换可以很容易地确定合适的分解尺度。Yoshida等人利用共轭梯度法对小波系数进行加权,对小波变换进行优化,使分类误差最小。Phadke等人[5]采用小波分解对微钙化进行检测和分类。将分解过程产生的系数作为特征,利用人工神经网络进行分类。

另一方面,一些研究者研究了利用高阶统计特征来完成分类任务。Balakumaran等人[6]利用二值小波变换来增强乳腺图像,利用高阶统计量除了模糊聚类来检测微钙化。Gurcan等人将乳房x线照片进行小波分解,然后计算这些系数的高阶统计量。然后对这些措施进行阈值,以确定是否存在微钙化。

本文提出了一种新的基于统计、基于特征的DWT和WPD的微钙化检测方法。特征选择任务采用t检验,不同类型的SVM核函数被采用给算法组合,以获得在系统灵敏度、特异度和准确度方面能够达到最佳性能的算法组合。

二、方法和数据

2.1. Dataset formation stage
本研究利用MIAS[8]和DDSM[9]数据库对该方法进行了评价。形成的MIAS数据集包含48张数字乳腺摄影图像,包括24张正常图像和24张含有微钙化的图像,而DDSM数据集包含100张正常乳腺图像和100张含有微钙化的乳腺图像。感兴趣区域(ROIs),如图2所示,对于MIAS图像选择64*64大小,对于DDSM图像选择256*256大小,因为DDSM乳房x线照片的分辨率几乎是MIAS的4倍。

MIAS数据集中抽取了37个正常的ROIs和37个含有微钙化的ROIs,而从DDSM数据集的200张图中抽取了100个正常的ROIs和107个含有微钙化的。

2.2 preprocessing stage

给DWT的ROIs使用了Db64小波分析。代表低频估计系数受到抑制,利用垂直、水平和对角细节重建增强的ROIs。对每个ROI,4张图用来重建;对角张,垂直,水平和所有细节。为了在ROI边界处避免小波重建伪影[10],我们在两倍面积的ROIs上采用了小波增强,对MIAS和DDSM数据,在中心处分别进一步切成32*32和128*128的大小。重建的图像传递给特征抽取层。

2.3 feature extraction stage

在ROIs中抽取描绘了相关信息的特征。所提出的特征本质上是统计性质的,是由一些经典特征集构成,包括高阶统计性质和基于小波的特征得到的。

2.3.1 classiccal features

在这项工作中,第三第四阶统计量称之为偏度和峰度,使用下列公式来计算ROIs:

是ROI中的灰度直方图,m是直方图均值,N是像素数。

对DWT特征,ROIs在不同尺度下用小波Db4分解。能量比与水平,垂直,对角线细节一致,用下列公式进行计算:

w是一个特定的子带向量,在给定尺度和N是系数数量,Et是总能量。

不像DWT,WPD由Coifman等[14]提出,WPD分解高频子图和低频子图。在本文中,ROIs在level 2中使用Db4小波。

2.3.2 proposed feature set

对之前描述的特征进行统计分析,提出的特征集共有4种。分别为 K-shape指数(KSI),Conformity Indices(CIs),Average Variablity指数(AVI)和百分比能量方差(PEV)。

KSI定义为峰度向量的峰度。用峰度来计算每个ROI图中的行和列,还有WPD的子带。用下列公式进行计算:

k是峰度向量,mk是K的均值,是K的平方差。l是K 的长度。

一般看来,在正常的乳腺区域中,峰度向量的直方图分布趋近于正态分布。另一方面,微钙化的存在使用峰度向量在包含微钙化的行列附近出现高峰,这使得峰度直方图出现偏差。通过对这些向量计算峰度,称为KSI,带有微钙化的ROIs有更高的KSI值。

Confomity indices主要衡量偏度和峰度向量的方差。这些indices对每个ROI图和它的WPD子带进行计算,它们可以用下面公式进行计算:

C是偏度峰度向量,Mc是均值,l向量C人长度。、

对正学中ROIs的行或列计算峰度向量,向量构成应该是彼此接近的,这是由于ROI的同质性。也就是说,向量直方图有窄分布和小偏差。进一步讲,微钙化情形下,峰度向量具有高方差,也就是说直方图宽分布。

同样,微钙化ROIs时,偏度向量的偏度分量较高。由于微钙化点比正常组织更亮,含有微钙化点的行/列将明显右偏,导致方差偏度直方图较高,如图4所示。为了利用这些变化,建议计算偏度和峰度向量的方差,当有微钙化ROIs时,其CIs值高于正常区域。

对于含有微钙化的ROIs,计算ROI的行或列的方差向量的元素显著高于正常ROI。这反映为一个这个向量比正常组织有更高的均值。这促使我们提出AVI度量来定义为方差向量的均值。对每个ROI图像及其对应的WPD子带进行计算。计算公式如下:

sigma方是方差向量,l是方差向量的长度。

能量向量的百分比即对角向量、垂直向量和水平向量由若干个与分解水平相等的元素组成。每一个元素都代表了在特定尺度上的能量和在这个尺度上的总能量的比值。在存在微钙化的情况下,我们观察到每个百分比能量向量中的某些元素将占主导地位。因此,这将导致一个相对较高的方差,而在正常情况下,元素将有更接近的值,从而降低方差。在本文中,我们使用Db4小波对每一幅尺度为3,4的ROI图像进行了能量向量的方差计算,称为PEV特征。

2.4 feature selectin and classification stages

用学生t检验作为统计特征选择算法。SVM用来分类,SVM核分虽用了线性核和RBF核,来研 究不同的核如何影响性能。

三、 result and discussion

为了评估新提出的特征集的重要性,使用了48幅来自MAIS数据库的图像和200幅来自DDSM数据库的图像。通过对MIAS数据集进行10重交叉验证和对DDSM进行20重交叉验证,计算了系统的精度、灵敏度和特异性,从而对系统性能进行鲁棒性评价。每个数据集进行两次试验;第一个使用线性SVM,第二个使用带RBF核的SVM。两个数据集的特征选择均采用t检验。

如表1所示,使用RBF核进行分类,使用t检验进行特征选择,在这两个数据集的性能都达到最佳。为了进一步验证该系统,绘制了ROC曲线。如图5所示,MIAS的AUC线性为0.8784,RBF为0.9189。对于DDSM,线性AUC为0.8919,RBF为0.9324

可以看出,RBF核的性能精度比线性核高2.7%左右。虽然RBF内核的计算开销相对于线性内核要高,但是性能度量的差异使得有必要使用RBF核。

尽管特征提取似乎非常昂贵,因为每张ROI有204个特征要计算,会有816(204 * 4)特征,测试时间为一个ROI等于3.229/4.0ms.对DDSM和MIA数据。在测试阶段特征所选择学习训练阶段t检验来筛选的35特征。说明该系统反应速度快,甚至可用于临床现场评估。然而,选择前特征的数量对学习时间有显著影响,对MIAS/DDSM的时间约为19.12 /113.99 s。使用2.4 GHz处理器和4gb RAM的PC计算学习和测试时间。

由表2可以看出,与Zhang等人引入的[17]、Arai等人引入的[18]、Simon等人引入的[19]相比,所提出的CAD系统取得了最好的性能指标。虽然Gurcan等人提出的[7]在检测灵敏度方面优于所有研究,但他们提出的系统对噪声的鲁棒性不强,因为该系统使用偏度和峰度参数的硬阈值来检测微钙化。在有噪声的图像中,这个硬阈值增加了假警报的概率。对于Balakumaran等人提出的[6]的研究,他们达到了与我们相同的敏感性。然而,微钙化的检测必须是结节状的,而我们提出的系统没有限制的结构形状。对于用于系统评价的数据集,Zhang等人的[17]和Simon等人的[19]使用了MIAS数据库中的25张微钙化图像,Arai等人的[18]使用了日本计算机辅助医学成像技术学会的12张微钙化图像。此外,Gurcan等人的[7]使用Nijmegen数据库与40 张微钙化图像。Balakumaran等人的[6]研究采用了DDSM。然而,比较仍然是公平的,因为MIAS和DDSM数据库都被用来评估该系统的鲁棒性。

四、结论

在本文中,我们提出了一种基于WPD、DWT产生的子带统计分析和基于高阶统计特征的微钙化检测新特征集。我们使用t检验进行特征选择,然后使用线性和RBF核支持向量机。实验结果表明,新特征集对提高系统性能具有重要意义。将特征选择的t检验与支持向量机分类的RBF核相结合,得到了最优的分类性能。所提出的特性还证明,它们仅能提供比传统现有特性更好的性能。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值