ufldl学习笔记与编程作业：Logistic Regression（逻辑回归）

最新推荐文章于 2022-11-05 18:50:19 发布

我的猫叫汤圆

最新推荐文章于 2022-11-05 18:50:19 发布

阅读量554

点赞数

分类专栏： deep learning

本文链接：https://blog.csdn.net/hp741852/article/details/75097599

版权

deep learning 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本节学习链接http://ufldl.stanford.edu/tutorial/supervised/LogisticRegression/

逻辑回归，顾名思义，就是只能判断逻辑问题的一种算法，具体来说，就是只能在结果中给出‘0’或者‘1’。所以本质上来说，这是解决分类问题的算法。
具体来说，逻辑回归的步骤和线性回归很像，下面给出假设函数 $h_\theta(x)$ ：

P (y = 1 | x) P (y = 0 | x) = h θ (x) = 1 1 + exp ( - θ ⊤ x ) \equiv σ (θ ⊤ x), = 1 - P (y = 1 | x) = 1 - h θ (x) .

$\begin{align} P(y=1|x) &= h_\theta(x) = \frac{1}{1 + \exp(-\theta^\top x)} \equiv \sigma(\theta^\top x),\\ P(y=0|x) &= 1 - P(y=1|x) = 1 - h_\theta(x). \end{align}$
可以看到，这里的

hθ(x) $h_\theta(x)$ 表示的是一种概率，通过判断概率大小来判定结果应该取‘1’或‘0’。
相应的，代价函数

J(θ) $J(\theta)$ 也变成了下面的形式：

J (θ) = - \sum i (y (i) log (h θ (x (i))) + (1 - y (i)) log (1 - h θ (x (i)))) .

$\begin{align} J(\theta) = - \sum_i \left(y^{(i)} \log( h_\theta(x^{(i)}) ) + (1 - y^{(i)}) \log( 1 - h_\theta(x^{(i)}) ) \right). \end{align}$
梯度函数和它的向量形式如下：

\partial J ( θ ) \partial θ j = \sum i x (i) j (h θ (x (i)) - y (i)) .

$\begin{align} \frac{\partial J(\theta)}{\partial \theta_j} = \sum_i x^{(i)}_j (h_\theta(x^{(i)}) - y^{(i)}). \end{align}$

\nabla θ J (θ) = \sum i x (i) (h θ (x (i)) - y (i))

$\begin{align} \nabla_\theta J(\theta) = \sum_i x^{(i)} (h_\theta(x^{(i)}) - y^{(i)}) \end{align}$
这部分的编程作业是识别 MNIST dataset中的手写体0和1，任务和上次一样，自己写代价函数和梯度函数，优化算法已经给出。

h = 1./(1+(exp(-(X'*theta))));
%h = sigmoid(X'*theta); 
f=-y*log2(h)+(1-y)*log2(1-h);
g=X*(h-y');

注释中的sigmoid函数是资料中已经写好的函数，不是MATLAB自带函数，具体作用和上面未注释的式子是一个意思，这部分的代码都是用矩阵运算完成的，所以下一课的矢量化编程不打算写了，以前没有经常使用MATLAB的同学，或是只用来画图的同学（就是我/(ㄒoㄒ)/~~），对于矢量化可以在纸上画一画矩阵理解一下，MATLAB的工作区里也可以看到参数的矩阵的相应形式，相比用for循环，矩阵运算在MATLAB中确实很快。