回归:在坐标系里存在许多数据点,我们找到一条直线去区分这些数据点,这个过程叫回归。
逻辑回归:用来解决二分类问题,用于估计某事物的可能性。例如,某病人换某种病的可能性,某顾客购买某种商品的可能性。这里的可能性并不是概率。其可能性常常与特征值加权求和。
用逻辑回归做分类任务,我们需要把每个特征值乘以不同的回归系数,再相加,放入到sigmoid中转化成0-1之间的数。假设阈值设为5,该数大于0.5,为1类;该数小于0.5,为0类。sigmoid= 1/(1+e(-z)),常常被用来作为激活函数,其功能是将变量值变成0到1之间的值。其中z=w0x0+w1x1+w2x2+…+wnxn(x为特征,w为回归系数)。整个模型的训练就是找到最优的回归系数。训练最优的回归系数方法是梯度上升法。