逻辑回归是解决分类问题。样本的输入X是标量矩阵,而输出y是标记,只有固定几个值。
举个例子,给你一系列参数,病人的年龄,身高,体重,肿瘤数量,肿瘤大小,一些血液参数等,判断病人得的是恶心肿瘤(1)还是良性肿瘤(0)。
从标量寻找一个模型映射到标记变量是困难的。于是转变思路,把这个病人是否得恶性肿瘤转为这个病人有多少概率得恶性肿瘤,这个概率在0-1之间,是一个连续的变量,我们可以规定概率超过某个阀值就诊断病人得的是恶性肿瘤。
那么我们的问题就是从 X → p ( y ) ( 0 ≤ p ( y ) ≤ 1 ) X\rightarrow p(y)(0\le p(y) \le1) X→p(y)(0≤p(y)≤1)
求X中不同特征值对y的影响,我们很容易想到线性组合: X β X\beta Xβ
这样我们需要求的一个函数就是 X β → p ( y ) ( − ∞ , ∞ ) → ( 0 , 1 ) X\beta\rightarrow p(y) \ \ \ (-\infin,\infin)\rightarrow(0,1) Xβ→p(y) (−∞,∞)→(0,1)
sigmoid 函数正好是这样的一个函数,它的图像如图:
s i g m o i d ( x ) = 1 1 + e − x sigmoid(x)=\frac{1}{1+e^{-x}} sigmoid(x)=1+e−x1
将上式中的x替换为 X β X\beta Xβ 得到: h β ( X ) = 1 1 + e − X β h_\beta(X)=\frac{1}{1+e^{-X\beta}} hβ(X)=1+e−Xβ1
这个就是我们逻辑回归的模型啦。
下面定义代价函数:
h β ( X ) h_\beta(X) hβ(X)是一个值域为(0,1)的函数,我们希望当
h β (