统计学习方法第六章逻辑斯谛回归与最大熵模型读书笔记

辰明Xucy

已于 2022-11-14 11:20:50 修改

阅读量160

点赞数 1

文章标签：学习方法回归

于 2022-10-31 21:19:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50650660/article/details/127623701

版权

第六章逻辑斯谛回归与最大熵模型

两者都属于对数线性模型

6.1 逻辑斯谛回归模型

6.1.1 逻辑斯谛分布

在这里插入图片描述

在这里插入图片描述

F(x) 非减，有界，连续------>F(x)为分布函数

f(x)关于x=μ对称，在此处取得最大时1/4γ

6.1.2 二项逻辑斯谛回归模型

在这里插入图片描述

将ω和x进行扩充，分别扩充b与1，ω·x+b可以简化成ω·x

该模型的输入输出变量间不存在线性关系
逻辑回归的输入变量可以是连续变量也可以是离散变量
参数估计采用最大似然估计法

特点

一个事件的几率(odds)是指该事件发生的概率与该事件不发生的概率的比值。

在这里插入图片描述

在这里插入图片描述

6.1.3 模型参数估计

在这里插入图片描述

6.1.4 多项逻辑斯谛回归

在这里插入图片描述

6.2 最大熵模型

最大熵原理认为，学习概率模型时，在所有可能的概率模型中，熵最大的模型就是最好的模型

6.2.1 最大熵原理

6.2.2 最大熵模型的定义

原始问题和对偶问题

拉格朗日乘子法

在这里插入图片描述

α，β为拉格朗日乘子，α_i≥0，c_i(x)≤0，h_j(x)=0

考虑关于x的函数

在这里插入图片描述

采用遍历的方式将所有的 α,β 一个一个代入拉格朗日函数中那么就相当于我们已知 α,β 。那么上述函数就是关于 x 的函数，下标P代表primal。

至于要借用一个L函数即可完成，无需列出约束条件

原始问题的最优值

考虑α，β的函数，

D为dual

对偶问题的最优值

称为广义拉格朗日函数的极大极小问题。将广义拉格朗日函数的极大极小问题表示为约束最优化问题

如果原始问题与对偶问题都有最优解，则

6.2.3 最大熵模型的学习

6.3 模型学习的最优化方法

6.3.1 改进的迭代尺度法

算法 6.1 改进的迭代尺度算法IIS

6.3.2 梯度下降法

算法6.2 梯度下降法：最大熵模型

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法第六章逻辑斯谛回归与最大熵模型读书笔记

逻辑斯谛回归
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。