深度学习入门基于python理论和实践读书笔记（十二）

最新推荐文章于 2019-12-10 14:15:41 发布

怎么会有不写代码的小朋友呢

最新推荐文章于 2019-12-10 14:15:41 发布

阅读量168

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/jiangyutongyangyi/article/details/102975510

版权

深度学习专栏收录该内容

15 篇文章 6 订阅

订阅专栏

第五章误差反向传播法第六节

Affine层

现将求矩阵于偏置的和的运算用计算图表示出来。将乘积运用“dot”节点表示，则np.daot(x,w)+B的运算可用下图表示，并且在变量上面标记他们的形状。
在这里插入图片描述
反向传播的示意图为

图中左上角那两个公式我没有去推到，等需要我了解更加深入一层的时候再推导吧。
各个变量的形状。尤其要注意，X和αL/αX形状相同，W和αL/αW形状相同。从下面的数学式可以很明确地看出X和αL/αX形状相同。
在这里插入图片描述
书上说αL/αY形状是(3,)，W的形状是(2, 3)时，思考和WT的乘积，使得αL/αX的形状为(2,)
这样一来，就会自然而然地推导出上上副图左上角的那个公式了。我就是很不明白，只是矩阵形状一样而已，为什么相乘就相等了，迷迷糊糊。

批版本的Affine层

之前Affine层的输入都是以单个数据为对象。现在我们考虑N个数据一起正向传播的的情况。
批版本Affine层的计算图
在这里插入图片描述
与之前不同的是输入的X的形状是（N，2）,反向传播和单个的时候一样的推导。加上偏置时，需要特别注意。正向传播时，偏置被加到X·W的各个数据上。

class Affine:
    def __init__(self,W,b):
        self.W = W
        self.b = b
        self.x = None
        self.dW = None
        self.db = None
    def forward(self,x):
        self.x = x
        out = np.dot(x,self.W)+self.b
        return  out
    def backward(self,dout):
        dx = np.dot(dout,self.W.T)
        self.dW = np.dot(self.x.T,dout)
        self.db = np.sum(dout,axis=0)

这一小节的代码感觉不难，但是就是这个反向传播这个公式感觉还是不太懂，主要是我道行太浅了。等我再修炼几个月，说不定就晓得是啥子啦。

Softmax-with-Loss

softmax层的输出的示意图
在这里插入图片描述
实现代码其实也是套公式就是方向传播的公式书上没有具体推。到时候要用的时候，再细看公式是怎么推的吧

import sys, os
sys.path.append(os.pardir) # 为了导入父目录中的文件而进行的设定
sys.path.append('H:/pythonfile/ch01/')
sys.path.append('H:/pythonfile/ch03/')
import numpy as np
from  mini_batch import *
from activeFunction import *
class Relu:
    def __init__(self):
        self.mask = None

    def forward(self,x):
        self.mask = (x <= 0)
        out = x.copy()
        out[self.mask] = 0
        return  out
    def backward(self,dout):
        dout[self.mask] = 0
        dx = dout
        return  dx
class sigmiod:
    def __init__(self):
        self.out = None
    def forward(self,x):
        out = 1/(1+np.exp(-x))
        self.out = out
        return  out
    def backward(self,dout):
        dx = dout*(1.0-self.out)*self.out
        return
class Affine:
    def __init__(self,W,b):
        self.W = W
        self.b = b
        self.x = None
        self.dW = None
        self.db = None
    def forward(self,x):
        self.x = x
        out = np.dot(x,self.W)+self.b
        return  out
    def backward(self,dout):
        dx = np.dot(dout,self.W.T)
        self.dW = np.dot(self.x.T,dout)
        self.db = np.sum(dout,axis=0)
class SoftmaxWithLoss:
     def __init__(self):
         self.loss = None # 损失
         self.y = None # softmax的输出
         self.t = None # 监督数据（one-hot vector）
     def forward(self, x, t):
         self.t = t
         self.y = activeFunction.softmax(x)
         self.loss = mini_batch.cross_entropy_error(self.y, self.t)
         return self.loss
     def backward(self, dout=1):
         batch_size = self.t.shape[0]
         dx = (self.y - self.t) / batch_size
         return dx

怎么会有不写代码的小朋友呢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习入门基于python理论和实践读书笔记（十二）

第五章误差反向传播法第六节Affine层现将求矩阵于偏置的和的运算用计算图表示出来。将乘积运用“dot”节点表示，则np.daot(x,w)+B的运算可用下图表示，并且在变量上面标记他们的形状。反向传播的示意图为图中左上角那两个公式我没有去推到，等需要我了解更加深入一层的时候再推导吧。各个变量的形状。尤其要注意，X和αL/αX形状相同，W和αL/αW形状相同。从下面的数学式可以很...
复制链接

扫一扫