随着计算机计算能力的增强和大批量医学图像的涌现,机器学习技术在医学图像处理领域的应用已获得越来越多的关注。其思想是通过计算机对大批量训练数据的统计学习,来预测新的待处理图像的相关信息。关于统计学习,推荐一本斯坦福的Hastie在2009年写的书: The Elements of Statistical Learning: Data Mining, Inference and Prediction (pdf)
统计学习的基本模型
统计学习的主要目标是对一个输出变量y对输入变量x的依赖进行建模。这种依赖关系可以定义为一个后验概率分布p(y|x),该分布可以用来预测一个样本x所对应的输出y。例如在图像分割方面,x可以是一个像素点岁对应的特征向量,而y则是其类别标号(目标器官或者背景)。对p(y|x)的建模有两种方式,一种是学习x与y的联合分布p(x,y),称之为产生式模型(generative model), 一种是直接学习这个条件概率p(y|x),称之为判别模型(discriminative model)。有些研究者发现随着样本容量的增大,产生式模型有一些优点,但在大多数的应用中,判别模型还是应用得更广泛,主要是因为数据的实际分布很难估计。
分类问题与回归问题
如果y对应于一个离散变量,该问题就是一个分类问题,例如y=1代表x属于目标器官而y=0代表背景。如果y对应一个连续变量,则该问题就是一个回归问题。例如在目标器官定位中,y可以是一个器官的位置。在图像处理中