02 神经网络 - 神经网络和深度学习 [Deep Learning Specialization系列]

最新推荐文章于 2022-11-06 11:35:15 发布

puran1218

最新推荐文章于 2022-11-06 11:35:15 发布

阅读量903

点赞数 2

分类专栏： AI Deep Learning 文章标签：神经网络深度学习人工智能

本文链接：https://blog.csdn.net/puran1218/article/details/104563081

版权

本文是Deep Learning Specialization系列课程的第1课《Neural Networks and Deep Learning》中Logistic Regression as a Neural Network部分的学习笔记。

内容包括：

逻辑回归和二进制分类
损失函数、代价函数和梯度递减法
计算图
正向传播和反向传播
向量化

1. 逻辑回归和二进制分类

逻辑回归（Logistics Regression）是用来处理二进制分类（Binary Classification）的一个算法，比如简单的是猫（1）或不是猫（0）的图像分类问题。

对一张RGB图片，计算机是以像素来存储的，假如输入的是一个6464的RGB图片，其总共大小为6464*3=12288。那么输入数据x的维度就是nx = 12288。

二进制分类，就是输入图片（将其转换为向量x），通过一个分类方法，来判断这个图片上的内容（输出y）。
这里单个训练数据就是（x, y）, 其中，x是 $n_x$ 维的特征向量，y是1或0的标注数据。

当训练数据集有m个时，训练数据就可表示为
${ {(x^{(1)}, y^{(1)}), (x^{(2)}, y^{(2)}), …, (x^{(m)}, y^{(m)})}\}$
此时训练数据集中的X就是 $n_x*m$ 维度的矩阵了，而Y是 $1 * m$ 维度的矩阵。
数据集m的情况

逻辑回归

继续上面的二进制分类问题，当我们输入x（比如说转变为特征向量的图片），得到 $\hat y$ ，这个 $\hat y$ 是这个标注结果y的一个概率，即 $p (y = 1 ∣ x)$ 。
这里，x仍是一个 $n_x$ 维度的特征向量。

对于线性回归问题，这里会涉及到两个参数：w和b，其中w是和x同维度的向量，b是一个实数（也成为偏置，bias）。最后的方程式是：
$\hat y = w^T * x + b$

由于 $\hat y$ 是 y=1 的概率，对上面的公式，我们应该加一个函数将其限定在(0, 1)这个区间内，这个函数就叫做激活函数(Activate Function)，比如sigmoid、relu函数。
输出: $\hat y = \sigma (w^T * x + b)$
sigmoid函数： $\sigma (z) = 1 / (1 + e^{-z})$
逻辑回归
一般情况下，我们会把w和b分开来处理，但可能有些研究会将其合并为统一的参数。