CH06最大熵模型

本文介绍了最大熵模型的基本原理,强调在面对未知变量时,最大熵模型倾向于采用最大熵(即均匀分布)作为最保守的选择。学习过程中通过最大似然估计来满足约束条件。利用拉格朗日乘数法求解,尽管求导后得到的函数是凸的,但直接求解w可能涉及鞍点问题。最大熵模型的求解方法包括梯度下降、牛顿法、拟牛顿法和IIS算法。作者探讨了模型学习与极大似然估计的关系,并提供了实现过程,包括特征函数的定义和计算w的改变量的IIS算法。
摘要由CSDN通过智能技术生成

1.最大熵模型:对于未知变量,倾向于最大熵(均匀分布),因为这样最保险

2.学习时候进行最大似然估计

约束条件:也就是求出的条件分布尽量符合数据情况

3.求解的时候使用拉格朗日方法,

先求w才行,但是这个对于P是凸函数,就对P求导,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值