概念
- 也叫逻辑回归,一种分类算法。通过sigmoid函数将输出值映射到0-1的范围,代表概率预测。
- w为特征值的权值,b为偏置。该函数是一条S形的曲线,并且曲线在中心点附近的增长速度较快,在两段的增长速度较慢。w值越大,曲线中心的增长速度越快。Y(x)是一个概率分布函数,因此对于二分类而言,离中心点的距离越远,其属于某一类的可能性就越大。
代价函数
- 估计模型参数w和b。
- 给定y值为1时,代价函数曲线横坐标的值,即决策函数Y(x)越接近1,则代价越小,反之越大。类似的,当给定y值为0时,Y(x)越接近0,则代价越小。
- 将m个样本的代价累加并平均,就可以得到最终的代价函数
y=0或1,可得
当最终代价函数最小的时候,所得参数即为最优。 - 参数的优化可通过梯度下降法。重复更新步骤,直到代价函数的值收敛为止。
sklearn LogisticRegression
class sklearn.linear_model.LogisticRegression