C2-第一周作业

最新推荐文章于 2020-10-07 02:30:01 发布

JiangCaifu

最新推荐文章于 2020-10-07 02:30:01 发布

阅读量270

点赞数

1.初始化数据

import numpy as np
import matplotlib
import matplotlib.pyplot as plt
import sklearn
import sklearn.datasets
import init_utils#第一部分，初始化
import reg_utils#第二部分，正则化
import gc_utils#第三部分，梯度校验
plt.rcParams["figure.figsize"]=(7.0,4.0)#set default size of plots
plt.rcParams['image.interpolation']='nearest'
plt.rcParams['image.cmap']='gray'
train_X,train_Y,test_X,test_Y=init_utils.load_dataset(is_plot=True)
plt.show()
def model(X,Y,learning_rate=0.01,num_iterations=15000,print_cost=True,
          initialization="he",is_plot=True):
    """
       实现一个三层的神经网络：LINEAR ->RELU -> LINEAR -> RELU -> LINEAR -> SIGMOID

       参数：
           X - 输入的数据，维度为(2, 要训练/测试的数量)
           Y - 标签，【0 | 1】，维度为(1，对应的是输入的数据的标签)
           learning_rate - 学习速率
           num_iterations - 迭代的次数
           print_cost - 是否打印成本值，每迭代1000次打印一次
           initialization - 字符串类型，初始化的类型【"zeros" | "random" | "he"】
           is_polt - 是否绘制梯度下降的曲线图
       返回
           parameters - 学习后的参数
       """
    grads={}
    costs=[]
    m=X.shape[1]
    layers_dims=[X.shape[0],10,5,1]
    #选择初始化参数的类型
    if initialization=="zeros":
        parameters=initialize_parameters_zeros(layers_dims)
    elif initialization=="random":
        parameters=initialize_parameters_random(layers_dims)
    elif initialization=="he":
        parameters=initialize_parameters_he(layers_dims)
    else:
        print("错误的初始化参数，退出程序")
        exit()
    #开始学习
    for i in range(0,num_iterations):
        #向前传播
        a3,cache=init_utils.forward_propagation(X,parameters)
        #计算成本
        cost=init_utils.compute_loss(a3,Y)
        #反向传播
        grads=init_utils.backward_propagation(X,Y,cache)
        #更新参数
        parameters=init_utils.update_parameters(parameters,grads,learning_rate)
        #记录成本
        if i%1000==0:
            costs.append(cost)
            #打印成本
            if print_cost:
                print("第"+str(i)+"次迭代，成本值为："+str(cost))
    #学习完毕，绘制成本曲线
    if is_plot:
        plt.plot(costs)
        plt.ylabel('cost')
        plt.xlabel('iterations(per hundreds)')
        plt.title("learning rate="+str(learning_rate))
        plt.show()
    #返回学习完毕后的参数
    return parameters
#初始化为0
def initialize_parameters_zeros(layers_dims):
    """将模型参数全部设置为0
    参数：
        layers_dims - 列表，模型的层数和对应每一层的节点的数量
    返回
        parameters - 包含了所有W和b的字典
            W1 - 权重矩阵，维度为（layers_dims[1], layers_dims[0]）
            b1 - 偏置向量，维度为（layers_dims[1],1）
            ···
            WL - 权重矩阵，维度为（layers_dims[L], layers_dims[L -1]）
            bL - 偏置向量，维度为（layers_dims[L],1）
    """
    parameters={}
    L=len(layers_dims) #网络层数
    for l in range(1,L):
        parameters["W"+str(l)]=np.zeros((layers_dims[l],layers_dims[l-1]))
        parameters["b"+str(l)]=np.zeros((layers_dims[l],1))
    return parameters
#测试模型
parameters=initialize_parameters_zeros([3,2,1])
print("W1="+str(parameters["W1"]))
print("b1="+str(parameters["b1"]))
print("W2="+str(parameters["W2"]))
print("b2="+str(parameters["b2"]))
parameters=model(train_X,train_Y,initialization="zeros",is_plot=True)
print("训练集：")
predictions_train=init_utils.predict(train_X,train_Y,parameters)
print("测试集：")
predictions_test=init_utils.predict(test_X,test_Y,parameters)
#预测和决策边界的细节
'''print("predictions_train="+str(predictions_train))
print("predictions_test="+str(predictions_test))
plt.title("Model with Zeros initialization")
axes=plt.gca()
axes.set_xlim([-1.5,1.5])
axes.set_ylim([-1.5,1.5])
init_utils.plot_decision_boundary(lambda x:init_utils.predict_dec(parameters,x.T),
                                  train_X,train_Y)'''
#随机初始化
def initialize_parameters_random(layers_dims):
    """将模型参数全部设置为0
    参数：
        layers_dims - 列表，模型的层数和对应每一层的节点的数量
    返回
        parameters - 包含了所有W和b的字典
            W1 - 权重矩阵，维度为（layers_dims[1], layers_dims[0]）
            b1 - 偏置向量，维度为（layers_dims[1],1）
            ···
            WL - 权重矩阵，维度为（layers_dims[L], layers_dims[L -1]）
            bL - 偏置向量，维度为（layers_dims[L],1）
    """
    np.random.seed(3)#指定随机种子
    parameters={}
    L=len(layers_dims) #网络层数
    for l in range(1,L):
        parameters["W"+str(l)]=np.random.randn(layers_dims[l],layers_dims[l-1])*10
        parameters["b"+str(l)]=np.zeros((layers_dims[l],1))
    return parameters
#测试模型
parameters=initialize_parameters_random([3,2,1])
print("W1="+str(parameters["W1"]))
print("b1="+str(parameters["b1"]))
print("W2="+str(parameters["W2"]))
print("b2="+str(parameters["b2"]))
parameters=model(train_X,train_Y,initialization="random",is_plot=True)
print("训练集：")
predictions_train=init_utils.predict(train_X,train_Y,parameters)
print("测试集：")
predictions_test=init_utils.predict(test_X,test_Y,parameters)
print(predictions_train)
print(predictions_test)
plt.show()
#抑梯度异常初始化
def initialize_parameters_he(layers_dims):
    '''
参数
    layers_dims - 列表，模型的层数和对应每一层的节点的数量
返回
    parameters - 包含了所有W和b的字典
        W1 - 权重矩阵，维度为（layers_dims[1], layers_dims[0]）
        b1 - 偏置向量，维度为（layers_dims[1],1）
        ··
        WL - 权重矩阵，维度为（layers_dims[L], layers_dims[L -1]）
        b1 - 偏置向量，维度为（layers_dims[L],1）
    '''
    np.random.seed(3)
    parameters={}
    L=len(layers_dims)#层数
    for l in range(1,L):
        parameters['W'+str(l)]=np.random.randn(layers_dims[1],layers_dims[l-1])*np.sqrt(2/layers_dims[l-1])
        parameters['b'+str(l)]=np.zeros((layers_dims[l],1))
        #使用断言确保我的数据格式是正确的
        assert(parameters['W'+str(l)].shape==(layers_dims[1],layers_dims[l-1]))
    return parameters
#测试函数
pparameters=initialize_parameters_he([2,4,1])
print("W1="+str(parameters["W1"]))
print("b1="+str(parameters["b1"]))
print("W2="+str(parameters["W2"]))
print("b2="+str(parameters["b2"]))
parameters=model(train_X,train_Y,initialization="he",is_plot=True)
print("训练集：")
predictions_train=init_utils.predict(train_X,train_Y,parameters)
print("测试集：")
init_utils.predictions_test=init_utils.predict(test_X,test_Y,parameters)

JiangCaifu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
C2-第一周作业

1.初始化数据import numpy as npimport matplotlibimport matplotlib.pyplot as pltimport sklearnimport sklearn.datasetsimport init_utils#第一部分，初始化import reg_utils#第二部分，正则化import gc_utils#第三部分，梯度校验plt...
复制链接

扫一扫