深度学习笔记-第3章-《深度学习入门——基于Python的理论与实现》

最新推荐文章于 2024-07-11 09:30:34 发布

mayavii

最新推荐文章于 2024-07-11 09:30:34 发布

阅读量1.7k

点赞数 1

本文链接：https://blog.csdn.net/qq_42731466/article/details/83351619

版权

这个书各位大佬都很熟悉，我就不多说了。这个系列的文章肯定不是很长，整个整合到
机器学习-笔记目录

深度学习笔记——《深度学习入门——基于Python的理论与实现》

第3章——神经网络

神经网络和感知机，我觉的是一回事，但是表示的方式发生了变化。
神经网络的第一层称为输出层，偏置b是在输入层的，并且权重是1，它直接进入了神经网络，表达方式有所变化了。此后激活条件修改了加权和大于0就会激活它。
…

注意到中间层，既可以接受多个输入也可以多向输出。
感知机和神经网络的区别就在于激活函数：h(x)=1/(1+exp(-x))
激活函数不止一种，sigmoid、ReLU函数
.
.
.

神经网络的实现

简单来说，对于神经的信息的收集

1.最简单的如下a是最终收集的信息之和，这里是一维，b是偏置，w是权重。

a = x*w +b

2.然后扩展到二维
a接受两个信息，输出层是x1，x2。也就是像最简单的感知机一样

a = w1*x1+w2x2+b

3.继续扩展当第一层输出层x1，x2，但是接受的神经不再是一个，而是a1，a2，a3三个的时候

a1 = w11*x1+w12*x2+b1
a2 = w21*x1+w22*x2+b2
a3 = w31*x1+w32*x2+b3

此时可以对它进行改写

B=(b1,b2,b3)
A=(a1,a2,a3)
X=(x1,x2)
W=(w11,w21,w31
-----w12,w22,w32)
A(1X3) = B(1X3) + X(1X2)*W(2X3)

一般形式：A=XW+B

于是A成为了下一个X
Xn=Xn-1*Wn-1+Bn-1

分类函数softmax

这个和恒等函数很不同，恒等函数采集了信号之后，输向下一级，而softmax受到不同信号的影响。
(0.3,2.9,4.0)经过某种变换之后得到(0.018,0.245,0.737),三者之和为1，它的间距被调整了。
这个函数是有一些性质的

1.可以认为它是对输出的概率，或者对分布的描述
2.输出之和恒等于1
3.因为是单调的，元素之间的大小关系是不变的

import numpy as np
def softmax(arr):
    # 接受ndarray
    arMax = np.max(arr)
    arr -= arMax    # 溢出策略
    arr = np.exp(arr)
    arr = arr/np.sum(arr)
    return arr

arr = np.array([1010,1000,990])
softmax(arr)

在这里插入图片描述

书中对于这三个输出的描述是，索引0,1,2的概率是1.8%、24.5%、73.7%。
我是没明白他这个概率是指的什么，为什么采用这个模型也是一个问题。
所以走到这里都还是一片迷雾。

3.6手写数字的识别

终于进入了高潮部分。

1.输出层的神经元数量需要根据待解决的问题来决定。

对于分类问题，输出神经元的数量一般设定为类别的数量。比如预测图中的数字是0-9的哪一个，（10个类别）那么输出层的数量就是10个。

MNIST数据集

这下把图补过来了。CAD绘制的。。我还没找到很好的绘制工具。。将就一下，想要这个图的我把文件提供一下
https://download.csdn.net/download/qq_42731466/10748151

这个图略去了备注部分，带备注的，所有的备注我都隐藏在CAD的图层里面了。

总结

问题汇总
1.sigmoid函数的平滑性对神经网络的学习有重要意义，这句话我是没读懂的。
2.神经网络的激活函数必须使用非线性函数。换句话说，激活函数不能使用线性函数。使用线性函数，加深神经网络的层数就没有意义了。

线性函数的问题在于，不管加深多少层，总是存在与之等效的无隐藏层的神经网络。

3.一般地，回归问题可以用恒等函数，二元分类可以用sigmoid，多元可以用softmax.

更新日志及进度

2018.10.24——

mayavii

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记-第3章-《深度学习入门——基于Python的理论与实现》

这个书各位大佬都很熟悉，我就不多说了。这个系列的文章肯定不是很长，整个整合到机器学习-笔记目录深度学习笔记——《深度学习入门——基于Python的理论与实现》第3章——神经网络神经网络和感知机，我觉的是一回事，但是表示的方式发生了变化。神经网络的第一层称为输出层，偏置b是在输入层的，并且权重是1，它直接进入了神经网络，表达方式有所变化了。此后激活条件修改了加权和大于0就会激活它。...
复制链接

扫一扫