一、最大熵原理
理论基础:学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。
最大熵模型:在满足约束条件的模型集合中选取熵最大的模型。
二、最大熵模型与逻辑斯蒂回归模型
都是对数线性模型,模型学习就是在给定的训练数据条件下对模型进行极大似然估计或正则化的极大似然估计。
是以似然函数为目标函数的最优化问题。似然函数的目标函数有很好的的性质,是光滑的凸函数,有多种方法可以找到最优解。
包括:改进的迭代尺度、梯度下降、牛顿、拟牛顿
一、最大熵原理
理论基础:学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。
最大熵模型:在满足约束条件的模型集合中选取熵最大的模型。
二、最大熵模型与逻辑斯蒂回归模型
都是对数线性模型,模型学习就是在给定的训练数据条件下对模型进行极大似然估计或正则化的极大似然估计。
是以似然函数为目标函数的最优化问题。似然函数的目标函数有很好的的性质,是光滑的凸函数,有多种方法可以找到最优解。
包括:改进的迭代尺度、梯度下降、牛顿、拟牛顿