机器学习笔记五:广义线性模型(GLM)

这篇博客探讨了广义线性模型(GLM),包括指数分布族的概念,如何证明线性回归、logistic回归和softmax回归属于这一族。GLM假设随机变量y的分布属于指数分布族,其自然参数η与输入x通过线性关系联系。线性回归中,η与x的线性组合对应高斯分布;logistic回归的η对应伯努利分布的logistic函数;softmax回归则适用于多分类问题,其η与多项式分布的softmax函数相关联。
摘要由CSDN通过智能技术生成

一.指数分布族

在前面的笔记四里面,线性回归的模型中,我们有这里写图片描述,而在logistic回归的模型里面,有这里写图片描述。事实上,这两个分布都是指数分布族中的两个特殊的模型。所以,接下来会仔细讨论一下指数分布族的一些特点,会证明上面两个分布为什么是指数分布族的特性情况以及怎么用到其他的模型上面去。
如果一类分布能够写成如下的形式,那么这个分布就能够被划归到指数分布族里面。
这里写图片描述
其中:

η 被称为这个分布的自然参数(natural parameter)或者canonical parameter
T (y) 被称为充分统计量(sufficient statistic) (在我们暂时用到的模型里面,你可以认为他就是 that T (y) = y)
a(η) 被称为log partition function. 这里写图片描述起到归一化常数的作用,确保这个分布累计起来为1。

当T , a,和b被选中固定之后,也就确定了一个分布的族,且以η为参数。如果我们改变η,我们就得到了不同的分布。
接下来我们看看怎么证明开始的那个伯努利分布和高斯分布是指数分布族里面的。

首先来看看伯努利分布:
伯努利分布可以写为一下的形式:
这里写图片描述
其中y的取值为0或者1,这个太简单了,就不多解释了。我们的目标就是选择a,b,T,使得这里写图片描述变为上面的伯努利分布的形式。下面直接给出推导。
首先伯努利分布可以写成:
这里写图片描述
看这个式子的形式,把

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值