菜鸟的数据分析学习记003 ---------EB520X--------GLM广义线性模型

本文介绍了线性模型的基本概念,包括基本形式、判断标准和特点。接着详细阐述了广义线性模型(GLM),特别是指数分布族,包括伯努利和高斯分布的推导。GLM由随机部分、系统部分和联接部分组成,用于处理不同类型的响应变量分布。GLM是线性模型的扩展,适用于更广泛的问题,如逻辑回归和泊松回归。
摘要由CSDN通过智能技术生成

本文为学习笔记,供自己复习回顾,分享,交流,如果专家们发现谬误之处欢迎批评与修正。

----------------------------------------------------------------------------------------------------------------------------

1.什么是线性模型?

在数学中,变量间关系有两种基本类型:函数关系和相关关系,函数关系是确定的可以用函数式表达出来的。

因此,线性模型就是一个响应变量(因变量)与其解释变量(因变量)的线性组合存在线性关系的模型。

1.1 基本形式

给定由 d 个属性描述的示例x=(x1;x2;x3;....;xd),其中xi 是 x 在第 i 个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数,即

 

                                              Y=w1x1+w2x2+....+wdxd+b+\varepsilon

 

其中 w 是属性权重,b 是偏移项,\varepsilon 是误差项,一般情况下偏移项与误差项统一处理,w 与 b 学得后,模型就可以确定了。

1.2 如何判别线性模型

我们很多情况认为直线就是线性模型,其实有些曲线也是线性模型,我刚接触这个概念时,一直很不解为什么逻辑模型是线性模型,所以在这里列出两条判断线性模型的标准方法。

1. 自变量前是否只有一个系数影响

e.g.  逻辑回归其分离面是一个线性超平面wx+b,  本质上是一个线性回归模型,其系数是线性函数,只是在其基础上加入了sigmoid映射,没有加入前其形式为

                                                               

加入后

                                                             

所以逻辑回归实质是一个线性模型。

2. 自变量前是否只有一个系数影响

 

 e.g.                     

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值