医学影像研究的重要性 计算机,计算机辅助医学影像诊查之关键学习技术研究.doc...

计算机辅助医学影像诊查之关键学习技术研究.doc

计算机辅助医学影像诊查之关键学习技术研究

-->第1章绪论

1.1计算机辅助诊断概述

医学影像学中的计算机辅助诊断技术通常分为三类:图像处理。图像处理的是让计算机易于识别可能存在的病变,让计算机从复杂的解剖背景中将病变及可疑结构识别出来。此过程需要将图像数字化,如果是数字化图像如DR、CT、MR图像则可省去此步。各种病变运用不同的图像处理方法,基本原则是图像增强与过滤将可疑病变从正常解剖背景中分离、显示出来;(2)图像分析。对图像中感兴趣的目标进行检测和测量(特征提取),它是一个从图像到数据的过程。最为典型的就是计算机辅助检测(puter Aided Detection)。在这个阶段计算机只具有初级人工智能的功能。当进行诊断工作时,计算机会告诉我们兴趣区(Range Of Interest, ROI)在哪里,提醒我们要特别注意这些区域的细微改变。而对于兴趣区性质的识别,还是需要我们人去进行;(3)图像理解。研究图像中各目标的性质和相互关系、理解图像含义。它是一个从图像到高级描述、识别的过程,这就是计算机人工智能的高级阶段一计算机辅助诊断。这个阶段计算机收集大量同病种、同部位的影像学信息建立“知识库”。利用机器学习技术针对“知识库”进行训练,使计算机“学会”根据以往的“经验”对当前的影像病变做出诊断建议。

…………

1.2数据挖掘概述

近十年来,数据挖掘与机器学习在医学辅助诊断、模式识别、欺诈检测等诸多领域得到了广泛应用与研究。数据挖掘与机器学习能有效分析原始数据,提取数据背后的隐含模式、发掘新知识并做出正确判断。与人类从过往经验中学习知识并利用其解决未来问题类似,数据挖掘从已知的经验数据中发现知识,并利用学习所得知识对未知数据进行判断。通常数据挖掘中所涉及的数据信息是以属性值(attribute-value)表示。数据包含许多实例(对象、样本等),每个实例以多个通用意义的特征来表示,而每个特征由有效的符号或数字值表示。数据实例及所含特征隐含地表达了知识,学习算法是将知识以能被理解及应用的形式表示出来。多年来由于分类在实际应用中的重要性而成为机器学习与数据挖掘中最主要的研究方向。本论文是研究分类问题,特别是二分类问题。许多分类方法已经被大家所熟知,譬如 KNN(K-Nearest Neighbor),NBC(NaYve Bayes Classifier),LDA(Linear Discriminant Analysis!),ANN(Artificial Neural Net(Support Vector Machines),Boosting 和 Bagging 等。许多先进学习算法及其各类改进算法能得到非常高的分类精度,例如采用SVM混合学习算法对基因微阵列数据的分类准确率可达90%以上甚至100%,并且不断有学者提出分类性能更优的学习算法。经过学者们对新学习算法的充分研究,目前设计更优性能的分类算法是一件十分困难的工作。分类算法的高准确率给人们一种机器学习无所不能的感觉,认为机器学习方法可以解决所有的分类问题,然而这样的印象与现实相去甚远。众所周知,目前还存在许多学习分类难题,譬如针对非平衡、有噪.稀缺等数据的学习分类。

…………

第2章相关研究现状

2.1非平衡数据集

数据集中当某一类别所包含的样本数显著少于其它类别的祥本数时,我们称之为非平衡数据集。进一步发现样本数少的类别往往是学习任务中用户最感兴趣的类别。许多实际的分类应用中都会出现非平衡样本集例如污染检测[29],风险管理[21]、欺诈侦察[22]以及医学辅助诊断123_24],非平衡数据集的分类问题引起学者们广泛的研究兴趣。在非平衡环境下,经典机器学习算法产生的分类界面偏离大类,会有更多稀有类样本被错分为大类,造成稀有类样本的识别率显著降低。非平衡的数据分布自身似乎不会影响学习过程,而以下与非平衡数据相关的困难阻碍了正常的学习过程。通常情况下非平衡样本集中没有充足的稀有类样本,使得学习机面临小样本问题,此时稀有类样本的识别率会显著降低。研究表明在固定非平衡比例的情况下随着稀有类样本数增加,稀有类别概念得到更为充分地表达,稀有类样本误判率也将随之降低。此时尽管样本集依然为非平衡分布,然而充分的样本能帮助学习机建立更为准确的稀有类概念模型。然而现实中收集更多阳性样本却是一项困难的工作。类别重叠问题。类别之间如果没有重叠,无论样本集是否平衡,任何一个简单的学习技术都能得到一个合适的分类器将类别完全分开。如图2-l(a)所示当类别重叠问题出现时,学习机很难推导出合适的判别准则。此时学习机通常会、推导出更普遍的判别准则,也就是稀有类别的样本更容易被误判。

…………

2.2非平衡学习性能评价

充分、详尽地评测学习算法性能是一项重要而且必要的工作,同时也是一项具有挑战性的任务

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值