Deep Neural Network

Deep Neural Network

仅用于自己学习使用

依赖的库

import numpy as np
import h5py
import matplotlib.pyplot as plt
from pyrsistent import b
from regex import B
import testCases #参见资料包,或者在文章底部copy
from dnn_utils import sigmoid, sigmoid_backward, relu, relu_backward #参见资料包
import lr_utils #参见资料包,或者在文章底部copy

初始化参数

def initialize_parameters_deep(layers_dims):

    np.random.seed(3)
    parameters = {}
    L = len(layers_dims)
    
    for l in range(1,L):

        parameters["W" + str(l)] = np.random.randn(layers_dims[l], layers_dims[l - 1]) / np.sqrt(layers_dims[l - 1])
        parameters["b" + str(l)] = np.zeros((layers_dims[l], 1))

    return parameters

前向传播

def linear_activation_forward(A_prev,W,b,activation):
    Z = np.dot(W,A_prev) + b
    if activation == "sigmoid":
        A, Z = sigmoid(Z)
    elif activation == "relu":
        A, Z = relu(Z)
    
    assert(A.shape == (W.shape[0],A_prev.shape[1]))
    cache = (A_prev, W, b,Z) # (A_prev, W, b,Z)
    
    return A,cache

 
def L_model_forward(X,parameters):

    caches = []    #[(X, W1, b1,Z1),(A1, W2, b2,Z2).....]
    A = X
    L = len(parameters) // 2
    for l in range(1,L):
        A_prev = A 
        A, cache = linear_activation_forward(A_prev, parameters['W' + str(l)], parameters['b' + str(l)], "relu")
        caches.append(cache) 
    
    AL, cache = linear_activation_forward(A, parameters['W' + str(L)], parameters['b' + str(L)], "sigmoid")
    caches.append(cache)
    
    assert(AL.shape == (1,X.shape[1]))
    
    return AL,caches

成本函数

def compute_cost(AL,Y):

    m = Y.shape[1]
    cost = -np.sum(np.multiply(np.log(AL),Y) + np.multiply(np.log(1 - AL), 1 - Y)) / m
        
    cost = np.squeeze(cost)
    assert(cost.shape == ())

    return cost

在这里插入图片描述

反向传播

def linear_activation_backward(dA,cache,activation="relu"):  #cache2 (A1,W2,b2,Z2)
    A_prev, W, b, Z = cache
    m = A_prev.shape[1]
    if activation == "relu":
        dZ = relu_backward(dA, Z)   
        dW = np.dot(dZ, A_prev.T) / m
        db = np.sum(dZ, axis=1, keepdims=True) / m
        dA_prev = np.dot(W.T, dZ)
      
    elif activation == "sigmoid":
        dZ = sigmoid_backward(dA, Z)  
        dW = np.dot(dZ, A_prev.T) / m
        db = np.sum(dZ, axis=1, keepdims=True) / m
        dA_prev = np.dot(W.T, dZ)
 
     return dA_prev,dW,db


def L_model_backward(AL,Y,caches):

    grads = {}
    L = len(caches)   
    m = AL.shape[1]
    Y = Y.reshape(AL.shape)
    dAL = - (np.divide(Y, AL) - np.divide(1 - Y, 1 - AL))
    
    current_cache = caches[L-1]
    grads["dA" + str(L)], grads["dW" + str(L)], grads["db" + str(L)] = linear_activation_backward(dAL, current_cache, "sigmoid")
    
    for l in reversed(range(L-1)):  #reversed 反转迭代器
        current_cache = caches[l]
        dA_prev_temp, dW_temp, db_temp = linear_activation_backward(grads["dA" + str(l + 2)], current_cache, "relu")
        grads["dA" + str(l + 1)] = dA_prev_temp
        grads["dW" + str(l + 1)] = dW_temp
        grads["db" + str(l + 1)] = db_temp
    
    return grads

更新参数

def update_parameters(parameters, grads, learning_rate):

    L = len(parameters) // 2 #整除
    for l in range(1,L):
        parameters["W" + str(l)] = parameters["W" + str(l)] - learning_rate * grads["dW" + str(l)]
        parameters["b" + str(l)] = parameters["b" + str(l)] - learning_rate * grads["db" + str(l)]
        
    return parameters

多层神经网络

def L_layer_model(X, Y, layers_dims, learning_rate=0.0075, num_iterations=3000, print_cost=False,isPlot=True):

    np.random.seed(1)
    costs = []
    
    parameters = initialize_parameters_deep(layers_dims)
    
    for i in range(0,num_iterations):
        AL , caches = L_model_forward(X,parameters)
        
        cost = compute_cost(AL,Y)
        
        grads = L_model_backward(AL,Y,caches)
        
        parameters = update_parameters(parameters,grads,learning_rate)
        
        #打印成本值,如果print_cost=False则忽略
        if i % 100 == 0:
            #记录成本
            costs.append(cost)
            #是否打印成本值
            if print_cost:
                print("第", i ,"次迭代,成本值为:" ,np.squeeze(cost))
    #迭代完成,根据条件绘制图
    if isPlot:
        plt.plot(np.squeeze(costs))
        plt.ylabel('cost')
        plt.xlabel('iterations (per tens)')
        plt.title("Learning rate =" + str(learning_rate))
        plt.show()
    return parameters

def predict(X, y, parameters):

    m = X.shape[1]
    n = len(parameters) // 2 # 神经网络的层数
    p = np.zeros((1,m))
    
    #根据参数前向传播
    probas, caches = L_model_forward(X, parameters)
    
    for i in range(0, probas.shape[1]):
        if probas[0,i] > 0.5:
            p[0,i] = 1
        else:
            p[0,i] = 0
    
    print("准确度为: "  + str(float(np.sum((p == y))/m)))
        
    return p

train_set_x_orig , train_set_y , test_set_x_orig , test_set_y , classes = lr_utils.load_dataset()

train_x_flatten = train_set_x_orig.reshape(train_set_x_orig.shape[0], -1).T 
test_x_flatten = test_set_x_orig.reshape(test_set_x_orig.shape[0], -1).T

train_x = train_x_flatten / 255
train_y = train_set_y
test_x = test_x_flatten / 255
test_y = test_set_y


layers_dims = [12288, 20, 7, 5,1] #  5-layer model
parameters = L_layer_model(train_x, train_y, layers_dims, num_iterations = 2500, print_cost = True,isPlot=True)

pred_train = predict(train_x, train_y, parameters) #训练集
pred_test = predict(test_x, test_y, parameters) #测试集

参考:https://blog.csdn.net/u013733326/article/details/79767169

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 深度神经网络Deep Neural Network)是一种基于神经网络机器学习模型,它由多个神经网络层组成,每一层都包含多个神经元。深度神经网络可以通过多次迭代训练来学习输入数据的特征,并用于分类、回归、图像识别、语音识别等领域。它是目前最先进的人工智能技术之一。 ### 回答2: 深度神经网络是现代机器学习和人工智能领域中最重要的概念之一。它是由多个神经网络层组成的神经网络结构,每一层都包含若干个单元。随着深度神经网络的层数不断增加,它可以逐渐学习到更加复杂的特征和规律,从而取得更加优秀的性能表现。 深度神经网络是一种基于前向反馈的人工神经网络,通常由输入层、若干个隐藏层和输出层组成。在每一层中,神经元会根据输入的数据向后传递信号进行计算和加权,最终输出结果。深度神经网络通过梯度下降算法对每一个神经元的权重和偏置进行微调,以最大化预测结果的准确性。 深度神经网络之所以能够取得惊人的表现,一方面是因为在每一层中使用了非线性激活函数,非常适合处理各种类型的数据。另一方面,更关键的是深度神经网络在训练过程中使用了反向传播算法,能够根据数据的真实标签对每一层的误差进行反向传播和修正,大大提升了训练效果。 深度神经网络已经在许多领域中广泛应用,如图像识别、语音识别、自然语言处理等。而随着技术的不断进步,深度神经网络仍将在未来的各种领域中发挥着越来越重要的作用。 ### 回答3: 随着人工智能技术的发展,深度神经网络Deep Neural Network/DNN)作为深度学习的代表,已经在图像识别、语音识别、自然语言处理等领域取得了重大突破,成为当今人工智能领域研究的热点之一。 深度神经网络是由多个神经网络层堆叠而成的模型,以层次化和分层抽象的方法将数据进行处理和分类,在计算机视觉领域中,深度神经网络的应用方向主要集中在三个方面:图像描述、目标检测和语义分割。 图像描述是指利用深度神经网络来分析图像内容并生成相应的文字描述,这对于机器自动化阅读图像、更好地理解图像语义有重要的价值; 目标检测则是指在图像中找出和定位特定目标的过程,例如在一组图片中找出其中的汽车、行人等; 语义分割是指将图像像素进一步分类,实现精细化的像素级别的图像分类和标注,这对于图像的更深入分析让计算机更好地理解图像的语义。 深度神经网络的成功离不开GPU计算的支持,家用计算机通过GPU加速,可以实现深度神经网络的训练和推断。同时,深度学习框架的应用也成为深度学习发展的推动力量之一,例如TensorFlow、PyTorch等深度学习框架大大降低了深度学习模型的实现难度,进一步推动了深度学习技术的发展。 总之,深度神经网络的发展,使计算机能够处理更加复杂的任务,这对人工智能技术的发展有着深远的历史意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

过路张

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值