1、LR的一般表述
一般的线性回归模型,输出值;对于分类模型来说,y>0表示正例,y<0表示负例。在很多场景中,我们希望输出值y能类似于概率一样介于0~1之间,所以可以通过一个映射函数,将其表示为:
,
映射函数的选择有很多种,最理想的是“单位阶跃函数”,但是单位阶跃函数不连续(即损失函数不可导),所以不能直接使用。我们希望找到一定程度上近似单位阶跃函数的替代函数,并希望它可单调可微。
对数几率函数是形状近似与S形的函数,是sigmoid函数的一种,它将z值转换为一个接近0或者1的y值,并且其输出值在z=0附近变化很陡。使用对数几率函数时:
直观地理解:
输出y为正例的概率
输出y为负例的概率
2、LR作为二分类的依据
如果了解线性回归的小伙伴都知道,线性回归时假设残差服从正态分布,而这里我们要提到logistic分布。logistic分布为:<