机器学习学习笔记（五）—

本文链接：https://blog.csdn.net/magiconecube/article/details/94553531

二分类问题

在分类问题中，一般不使用线性回归进行分类，因为效果很差。

在二元分类问题上，我们使用logistic回归进行分类

假设函数

在logistic回归中，有logistic函数
$g(z)=\frac{1}{1+e^{-z}}$
假设函数为
$h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$
假设函数 $h_\theta(x)$ 代表 $y = 1$ 的概率，则 $y = 0$ 的概率为 $1-h_\theta(x)$ 。

如果我们认为当 $h_\theta(x)>0.5$ 的时候，可以认为 $y = 1$ ;

且logistic函数有如下性质
$z\geq0,g(z)\geq0.5$
则我们可以认为如果 $\Theta^TX\geq0$ ，则 $y = 1$ ；如果 $\Theta^TX<0$ ，则 $y = 0$ 。那么我们可以用线 $\Theta^TX=0$ 将两类分离开，这条线称作决策边界。

代价函数

在今后我们统一将代价函数写为
$J(\Theta)=\frac{1}{m}\sum_{i=1}^{m}{cost(h_\Theta(x^{(i)}),y)}$
在logistic回归中由于平方误差函数不是凸函数，可能会落入局部最优解，我们使用如下的cost函数
$cost（h_\Theta(x),y)=\begin{cases} -log(h_\Theta(x))&y=1\\ -log(1-h_\Theta(x))&y=0\end{cases}$
则代价函数可以写为
$J(\Theta)=-\frac{1}{m}\sum_{i=1}^{m}{y^{(i)}log(h_\Theta(x^{(i)})+(1-y^{(i)})log(1-h_\Theta(x^{(i)}))}$

梯度下降

经过一些里骚操作推导得到梯度下降公式
$\theta_j:=\theta_j-\frac{\alpha}{m}\sum_{i=1}^{m}{(h_\Theta(x^{(i)})-y^{(i)})x^{(i)}_j}$
这里
$h_\Theta(x)=\frac{1}{1+e^{-\Theta^Tx}}$