01. 神经网络和深度学习 —— week3浅层神经网络（编程作业）

最新推荐文章于 2024-03-12 19:00:31 发布

涛涛酱

最新推荐文章于 2024-03-12 19:00:31 发布

阅读量416

点赞数 1

分类专栏：深度学习深度学习课程——吴恩达吴恩达——深度学习课程文章标签：吴恩达深度学习神经网络

本文链接：https://blog.csdn.net/iCode_girl/article/details/86774680

版权

本文介绍了如何使用非线性激活函数和交叉熵损失函数，通过建立包含隐含层的神经网络完成二分类任务。详细步骤包括定义网络结构、初始化参数、实现前向传播和反向传播，以及参数更新。并提供了相关代码和实验结果。

摘要由CSDN通过智能技术生成

1. 任务

用一个隐含层的神经网络实现一个二分类。
利用非线性的激活函数单元。
计算交叉熵损失函数。
实现向前传播和向后传播。

2. 网络结构

网络结构

3. 建立神经网络的方法

定义神经网络的结构（输入层，输出层，隐含层个数）。
初始化模型参数。
循环：
—实现向前传播。
—计算损失函数。
—为了得到梯度值，实现向后传播。
—更新参数（梯度下降）

4. 代码

import numpy as np
import matplotlib.pyplot as plt
from testCases import *
import sklearn
import sklearn.datasets
import sklearn.linear_model
from planar_utils import plot_decision_boundary, sigmoid, load_planar_dataset, load_extra_datasets

#%matplotlib inline #如果你使用用的是Jupyter Notebook的话请取消注释。

np.random.seed(1) #设置一个固定的随机种子，以保证接下来的步骤中我们的结果是一致的。

X, Y = load_planar_dataset()
#plt.scatter(X[0, :], X[1, :], c=Y, s=40, cmap=plt.cm.Spectral) #绘制散点图
shape_X = X.shape
shape_Y = Y.shape
m = Y.shape[1]  # 训练集里面的数量

print ("X的维度为: " + str(shape_X))
print ("Y的维度为: " + str(shape_Y))
print ("数据集里面的数据有：" + str(m) + " 个")

def layer_sizes(X , Y):
   """
   参数：
    X - 输入数据集,维度为（输入的数量，训练/测试的数量）
    Y - 标签，维度为（输出的数量，训练/测试数量）

   返回：
    n_x - 输入层的数量
    n_h - 隐藏层的数量
    n_y - 输出层的数量
   """
   n_x = X.shape[0] #输入层
   n_h = 4 #，隐藏层，硬编码为4
   n_y = Y.shape[0] #输出层

   return (n_x,n_h,n_y)

def initialize_parameters( n_x , n_h ,n_y):
   """
   参数：
       n_x - 输入节点的数量
       n_h - 隐藏层节点的数量
       n_y - 输出层节点的数量

   返回：
       parameters - 包含参数的字典：
           W1 - 权重矩阵,维度为（n_h，n_x）
           b1 - 偏向量，维度为（n_h，1）
           W2 - 权重矩阵，维度为（n_y，n_h）
           b2 - 偏向量，维度为（n_y，1）

   """
   np.random.seed(2) #指定一个随机种子，以便你的输出与我们的一样。
   W1 = np.random.randn(n_h,n_x) * 0.01
   b1 = np.zeros(shape=(n_h, 1))
   W2 = np.random.randn(n_y,n_h) * 0.01
   b2 = np.zeros(shape=(n_y, 1))

   #使用断言确保我的数据格式是正确的
   assert(W1.shape == ( n_h , n_x ))
   assert