Binary Classification
逻辑回归模型一般用来解决二分类问题,就是输出y只有两个离散值{0,1},例如判断图片中是否有猫,0表示nocat,1表示cat。通过这个例子简要介绍神经网络模型中一些标准化的、有效率的处理方法和notations。
图片包含三个RGB通道,设描述一张图片尺寸(64,64,3)。对这样一张图片要将x(64,64,3)转化为一维向量,方法是每个通道一行行取,在连接起来。64x64x3=12288,转化后的向量维度位(12288,1),为列向量,一般记为nx。
如果有m张图片,那么整个训练样本X组成矩阵,维度是(nx,m)。这里矩阵X的行nx代表了每个样本x(i)特征个数,列m代表了样本个数。这里,Andrew解释了X的维度之所以是(nx,m)而不是(m,nx)的原因是为了之后矩阵运算的方便。算是Andrew给我们的一个小小的经验吧。而所有训练样本的输出Y也组成了一维的行向量,写成矩阵的形式后,它的维度就是(1,m)。
Logistic Regression
如何使用逻辑回归解决二分类问题预测值h^=P(y=1|