5.广义线性回归

最新推荐文章于 2023-07-04 18:01:51 发布

AIgeeksu

最新推荐文章于 2023-07-04 18:01:51 发布

阅读量7.8k

点赞数 4

分类专栏：机器学习算法文章标签：广义线性回归指数族分布 softmax

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/geeksu/article/details/78146103

版权

机器学习算法专栏收录该内容

17 篇文章 3 订阅

订阅专栏

1. 首先我对前面几个章节做了一个总体概述如下：

其实我们前面论述的那些函数，无非可以总结成两种模式：

1）:我们假设y满足高斯分布，之后我们得到了基于最小二乘的线性回归模型。

2)

y 取 0 或者 1 ，在这种情况下，最为自然的 0~1 之间的分布是伯努利分布，对于这种情况我们得到了逻辑回归;

3）若你忘记了Bernoulli分布，这里给您做个提醒，若已经熟练掌握请忽略，伯努利分布的概率分布是：

2. 假设我们有一组只能取0和1的数据，我们希望使用伯努利分布对其建模，变量以为参数。

3. 指数族的引入（这里主要以离散型随机变量为例子）：

a) 对于伯努利分布：我们不要把它看成是固定的分布，可以看成通过改变可以得到不同的伯努利分布，当你改变值时得到了一类概率分布。

b) 同理我们考虑高斯分布,当你改变的时候，你会得到不同的高斯分布，所以再一次地将其视为一类或一组概率分布。

总结：以上两个分布其实是一类分布的特例，这类分布被称为指数族分布。相关资料引入如下：

c) 特别地，我们说一类概率分布，比如说改变值得到的伯努利分布，我们说某些概率分布属于指数族分布，比如说他能被写成这样的形式：

被称为分布的自然参数；

T(y)被成为充分统计量，通常情况下，我们常见的许多例子包括伯努利和高斯分布T(y)=y

d) 选定一种函数的形式，对于a,b和T我们固定了3个函数那么这个公式就定义了一个函数分布的集合，对于一组给定的a,b,T,当我们改变时，

我会得到不同的概率分布。

e) 接下来展示下伯努利分布和高斯分布都是指数族分布的特征，这意味着我们通过特定形式的a,b,T使这个公式变成伯努利或者高斯分布的形式，

当我们改变的值，我会得到均值不同的伯努利分布或者说当我改变时，我会得到均值不同的高斯分布，对于给定的a,b,T,T(y)其实是一个概率分布。

f) 最后补充一点，在很多情况下T(y)=y,也仅仅是个实数，所以是实数的乘积，对于我们的前2个例子是这样的，但是我们今天要讲的最后一个

例子会是一个例外。

4.现在我将向你展示伯努利分布和高斯分布都是指数族分布的特例：

1) 对于Bernoulli分布而言，我们的推演过程如下：

2）我们将结果类比指数族分布，则能得到这样的结论：

我们惊奇的发现式子(5)实际上就是我们在逻辑回归中使用的logisticsigmoid函数。

3）对于高斯分布而言：

3)我们再举一个例子，证明多项式分布本质上也是指数族分布：

在这之前我们先补充一点额外的知识，那就是指示函数，这对于我们推导多项式分布是指数族分布的特例具有重要意义：

我们用1来表示指示函数，之后用大括号内表示函数的参数，若指示函数的参数是真的，则返回1；若指示函数的参数是假的，

则返回0，其表述形式如下：

1{true} = 1

1{false} = 0

因此有实例：

1{1=3} = 0

1{1+1=2} = 1

4) 设置多项式分布有k个参数,p(y=i)=,即表示y=i的概率，则

则，

设置多项式分布有k个参数，然后并不视为参数。

5）同时我们引入以下向量：

我们可以将上面的向量表示为：,即表示向量T(y)的第i个元素，第y个向量的第i个元素。

6）有了指示函数，我们就可以将多项式分布用指示函数进行表示：

5. 广义线性回归算法（GLM）：

1) 给定特征属性x和参数后,y的条件概率服从指数族分布，即

2) 预测对应指数族分布中T(y)的期望，即计算E(T(y)|x)

3)指数族分布中的与特征向量x是线性关系，即

根据以上3个假设条件，我们将导出广义线性模型，并且得到非常漂亮的算法用来拟合模型。

对于第（3）个假定条件，如果是一个向量而不是一个实数，有：

例如：对于任意给定的x和，我的学习算法会进行一次预测，会输出：

也就是说：当我们进行机器学习算法时，若随机变量只能取0,1两个值，然后你会选择伯努利分布对其进行建模。注意

这个函数被成为正规相应函数，被称为正则关联函数。

6. 多项分布使用广义线性回归的拟合过程：

我们假设机器学习中y可以取k个值（），而不仅仅是2个值，例如你想设计一个学习算法自动地将发送给你的

邮件保存在正确的邮件目录中，如果你有10几个邮件目录，你希望你的算法能够将这些邮件分入到这些目录中；再例如，我们知

道病人生病或者没生病这是一个Bernoulli分布，但是如果你认为有可能患有k种病，希望你设计一个算法来帮助医生确定病人到底

得了那种病，当分类问题中的分类超过两种，此时你应该选择多项式分布进行建模:

1. 现在我们开始利用广义线性回归对多项式分布进行拟合：

由（7）我们可以推出：

所以我们T(y)的数据期望为：

这就是softmax模型，有了上面的基础，我们就可以进行如下总结：

假设你有一个机器学习问题y可能属于k类中的1类，会选择多项分布作为指数分布，接下来要处理集合：

我们通过使用极大似然估计算法有：

后面的计算比较简单，这里不做详细叙述，引入为主。

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
5.广义线性回归

1. 首先我对前面几个章节做了一个总体概述如下：其实我们前面论述的那些函数，无非可以总结成两种模式：1）:我们假设y满足高斯分布，之后我们得到了基于最小二乘的线性回归模型。2) y取0或者1，在这种情况下，最为自然的0~1之间的分布是伯努利分布，对于这种情况我们得到了逻辑回归;3）若你忘记了Bernoulli分布，这里给您做个提醒，若已经熟练掌握请忽略，
复制链接

扫一扫

专栏目录

AIgeeksu

CSDN认证博客专家 CSDN认证企业博客

码龄8年

30: 原创

6万+: 周排名

180万+: 总排名

3万+: 访问

: 等级

664: 积分

23: 粉丝

37: 获赞

20: 评论

43: 收藏

私信

关注

热门文章

分类专栏

最新评论

hudi spark avro兼容性问题
AIgeeksu: https://mvnrepository.com/artifact/org.apache.avro/avro
hudi spark avro兼容性问题
夕阳下的独行者: avro_avro.jar去哪里下载啊
1.线性回归的推导--梯度下降法
AIgeeksu 回复 qq_36134287: 谢谢指正，对了，我想了解下有没有什么好简单易用的方法能够在CSDN上写公式，我都是用word写出来的，截图，效率很低，而且容易出错
1.线性回归的推导--梯度下降法
qq_36134287: 有个地方错了，应该是xj而不是xi
4.Scala数组
wolunbafeite620: 最后三句arry操作{}中x与_的区别，虽然看的懂，但是什么时候用x什么时候用_还是不明白

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。