1 logit回归模型的简单介绍:
- 一种常见的机器学习算法
- 用来解决分类问题的,通常是二分类问题,但是也可以解决多分类问题。
- 具体应用:判断银行的客户是否会违约,判断客户是否是优质客户、判断某件产品是否会被销售出去等广泛的分类问题。
特点:具有较好的可解释性。
在logit模型中,因变量只有两个取值0或1.0表示阴性,代表事情没有发生;1表示阳性,表示事情发生了。例如,在预测信用卡是否会违约中,我们可以用0表示没有违约,1表示违约。
2. sigmoid 函数与logit模型:
我们不能采取简单的线性回归模型进行分类预测。我们需要引入一个特殊的函数:sigmoid函数。
在正式引入sigmoid函数之前,我们首先看一下采用线性回归模型存在的问题:
- 采用线性回归模型,要求误差项服从正态分布;但是,如果因变量只能取0-1两个值的情况下,误差项实际服从的不是正态分布,而是伯努利分布。
- 误差项也不是同方差的,而是异方差的。
- 因变量Y的取值也不一定在0,1之间。
这需要我们引入一个特殊的函数,将函数的取值范围压缩在0,1之间,这就需要使用到了sigmoid函数了。sigmoid函数的表达式和图像如下所示:
sigmoid函数的表达式:
exp是自然指数,是一个无限不循环小数;z则是自变量。
注意我们,可以分子、分母同时除以exp(z),得到
sigmoid函数的图像: