训练一个图像分类模型,实际上是训练了一个基于"最大似然估计"的模型. 所采用的softmax分类器, 别名也叫做 multinomial logistic regression.
为什么不能采用linear regression呢? 回答这个问题需要先了解liner regression 和 logistic regression的区别:
- 输出的区别. linear regression的输出是连续的,在有限空间可取任意值; logistic regression的输出期望是离散的,只有有限个数值.
- 预期目标(label)的区别. linear regression的预期是连续变量,如auto-encoder模型预测一张图像; logistir regression的预期是离散的类别.
- 最小化误差的方法区别. 采用均方误差的linear regression对于大的误差施加二次倍数的惩罚, 而logistic regression把较大的误差惩罚到一个渐进的常数.
- 先验的区别.liner regression期望拟合训练数据,通过feature的线性加权来预测结果; logistic regression是在训练一个最大似然分类器.
参考:链接