先推导了一下最大熵模型中的对数似然函数,请问似然函数是一般都选择联合概率吗?为什么最大熵模型的极大似然估计选择联合概率p(x,y)啊
有什么问题欢迎交流啊!
参考资料:
【改进的迭代尺度法(IIS)详细解析 | 统计学习方法学习笔记 | 数据分析 | 机器学习 - CSDN App】http://t.csdnimg.cn/LwBWT
【最大熵模型中的数学推导 - CSDN App】http://t.csdnimg.cn/HHCoo
【最大熵模型中的对数似然函数的解释 - CSDN App】http://t.csdnimg.cn/sztGV
李航,著. 统计学习方法[M]. 清华大学出版社