统计学习方法(三) logisitic回归与最大熵模型

本文对比了线性回归模型与Logistic回归模型,解释了为何在分类问题中选择Logistic回归。Logistic回归利用Sigmoid函数解决取值范围问题,其模型基于伯努利分布,采用极大似然估计进行参数优化,而线性回归模型适用于连续变量且假设误差为正态分布。Logistic回归是广义线性模型(GLM)的一种,允许输出依据任意分布并保持线性预测器。
摘要由CSDN通过智能技术生成

前言:本文实际为阅读众多LR相关资料总结而成,其中几个讲解得比较好的:

logistic回归--方法与应用 

对数线性模型,广义线性模型


在机器学习实战的逻辑斯蒂回归中我们有讲到,logistic模型就是使用sigmoid函数拟合条件概率,具体地:

此前,我的主要理解仅限于sigmoid函数及其函数图像形式。但是为什么使用这个函数来拟合自变量和因变量之间的关系呢?

一.线性回归模型LRM

    线性回归模型常用于定量分析中,其限制在于对因变量未做任何限制,这也就引入了假设--因变量y必须在负无穷正无穷之间变化。这就限制了线性回归模型的使用场景---不适用于因变量为分类变量的情况;不适用于因为量在有限区间取值的情况。

    对于二分类问题,假设使用线性回归方程:

其条件期望为:

由于y只能取值0和1,所以条件期望又等于:

正因如此,因变量为二分类的线性回归模型又称为线性概率模型(Linear Probability Model, 缩写LPM)。

    显然,概率取值范围[0, 1],线性模型不能拟合这种非线性关系,如下图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值