相信很多同学在学习对数几率回归(逻辑回归)时,都会有很多困惑,比如:
1.对数几率回归(逻辑回归)到底是用来干嘛的?
2.sigmoid函数是用来干嘛的?
3.z值为什么表示样本点属于其中一个类别的概率?
4.预测出的y值为什么是概率?
下面开始正文
首先,我们知道监督学习分为两类,一个是回归,一个是分类。
西瓜书中提到最简单的回归模型即为线性回归模型,线性回归模型可转化为广义线性模型,具体形式如下(其中g-1(.)称为联系函数):
对数几率回归(逻辑回归)本质上是用回归去解决分类问题(二分类问题)
西瓜书上说:“若要做分类任务,只需找一个单调可微函数将分类任务的真实标记y与线性回归模型的预测值联系起来。”
从而首先引入了单位阶跃函数,形式如下:
然而该函数不连续。不能直接用作g-1(x)
希