统计学习方法 第六章 逻辑斯谛回归与最大熵模型读书笔记

第六章 逻辑斯谛回归与最大熵模型

两者都属于对数线性模型

6.1 逻辑斯谛回归模型

6.1.1 逻辑斯谛分布

在这里插入图片描述

在这里插入图片描述

F(x) 非减,有界,连续------>F(x)为分布函数

f(x)关于x=μ对称,在此处取得最大时1/4γ

6.1.2 二项逻辑斯谛回归模型

在这里插入图片描述

将ω和x进行扩充,分别扩充b与1,ω·x+b可以简化成ω·x

  • 该模型的输入输出变量间不存在线性关系
  • 逻辑回归的输入变量可以是连续变量也可以是离散变量
  • 参数估计采用最大似然估计法
特点

一个事件的几率(odds)是指该事件发生的概率与该事件不发生的概率的比值。

在这里插入图片描述

在这里插入图片描述

6.1.3 模型参数估计

在这里插入图片描述

6.1.4 多项逻辑斯谛回归

在这里插入图片描述

6.2 最大熵模型

最大熵原理认为,学习概率模型时,在所有可能的概率模型中,熵最大的模型就是最好的模型

6.2.1 最大熵原理

image-20221107202518086

6.2.2 最大熵模型的定义

image-20221107210928777

image-20221107210526938

原始问题和对偶问题

拉格朗日乘子法

在这里插入图片描述

α,β为拉格朗日乘子,αi≥0,ci(x)≤0,hj(x)=0

考虑关于x的函数

在这里插入图片描述

采用遍历的方式将所有的 α,β 一个一个代入拉格朗日函数中那么就相当于我们已知 α,β 。那么上述函数就是关于 x 的函数,下标P代表primal。

image-20221109110543251

至于要借用一个L函数即可完成,无需列出约束条件

原始问题的最优值

image-20221109111452637

考虑α,β的函数,

image-20221109112731255

D为dual

对偶问题的最优值

image-20221109113529946

称为广义拉格朗日函数的极大极小问题。将广义拉格朗日函数的极大极小问题表示为约束最优化问题

如果原始问题与对偶问题都有最优解,则

image-20221109114118063

image-20221109114245717
image-20221109114438007

6.2.3 最大熵模型的学习

image-20221109125544782

image-20221109125600025

image-20221109125614743

6.3 模型学习的最优化方法

6.3.1 改进的迭代尺度法

image-20221111121206594

image-20221111123530663

算法 6.1 改进的迭代尺度算法IIS

image-20221111123835290

6.3.2 梯度下降法

image-20221114103100479

image-20221114103040215

算法6.2 梯度下降法:最大熵模型

image-20221114105950824

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值