我们都知道,如果预测值y是个连续的值,我们通常用回归的方法去预测,但如果预测值y是个离散的值,也就是所谓的分类问题,用线性回归肯定是不合理的,因为你预测的值没有一个合理的解释啊。比如对于二分类问题,我用{0,1}表示两类,那超出这个区间的预测值的意义是什么呢?所以我们就要引入一种特殊的回归方法,但通常用于分类问题,这就是Logistic回归,我们通过处理,将所有的预测值都限制在0到1以内,其形式如下:
这里要先介绍一下sigmoid函数,定义如下
它有一个特性如下
我们在Python中把它画出来看一下
import numpy as np
from matplotlib import pyplot as plt
def sigmoid(x):
return 1/(1+np.exp(-x))
x=np.linspace(-6,6,100)
y=sigmoid(x)
plt.plot(x,y,'r-')
plt.title('Sigmoid')
plt.show()