数据输入层_精通数据科学笔记深度学习

丁子栩

于 2020-12-22 18:37:21 发布

阅读量445

点赞数

文章标签：数据输入层

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34212182/article/details/112582130

版权

这一章主要介绍了ANN,CNN,RNN,LSTM,VAE,GAN

利用神经网络(ANN)识别数字

MNIST图集：0~9的手写数字图片，包含60000张训练图片和10000张测试图片，存储格式特殊，需要专门的程序解析

防止过拟合的惩罚项

ANN是很复杂的模型，非常容易发生过拟合，通用的方法是加入惩罚项，常用的惩罚项有三种：

防止过拟合之Dropout

在训练模型的每一步中随机暂时剔除一些神经元，在预测时，使用完整的网络，同时需要将相应的神经元输出扩大到原来的

倍，P是每个神经元被保留的概率。

卷积神经网络(CNN)

ANN丢失了像素之间的位置关系，CNN可以捕捉像素之间的位置关系和模拟人眼对图像的模糊处理

CNN的结构为：输入层，卷积层，池化层，全连接层。其中，卷积层和池化层是为了提取图像特征，全连接层相当于输出层

递归神经网络(RNN)

当前神经元的输出不但能影响后面神经元的状态，还能通过网络影响它前面的神经元。这相当于在神经网络里建立起时间或上下文的概念。

生产中应用广泛的一种递归神经网络：长短期记忆(LSTM),被广泛用于语音识别，自然语言处理和机器翻译等领域。

记长期记忆为

，短期记忆为

，模型输入为

,则长期记忆的更新机制为

若记忆力度为

，则

若更新力度为

,表示多大比例的长期记忆将转换成短期记忆，候选新增记忆为

长期记忆的更新公式为

非监督学习

VAE=神经网络+生成式模型

VAE属于全连接网络，网络结构通常是对称的，输入层和输出层的神经元个数相同，模型训练的目标是让输入层与输出层越相似越好。

通过神经网络的前半部分，找到相应的隐藏状态，这一步称为编码；然后根据得到的隐藏状态和后半部分神经网络得到还原之后的数据，这一步称为解码，理想情况下，解码之后得到的数据近似等于训练数据，通过这样的模型，我们可以得到数据不可观测的类别（数据的隐藏状态）

GAN

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据输入层_精通数据科学笔记深度学习

这一章主要介绍了ANN,CNN,RNN,LSTM,VAE,GAN利用神经网络(ANN)识别数字MNIST图集：0~9的手写数字图片，包含60000张训练图片和10000张测试图片，存储格式特殊，需要专门的程序解析防止过拟合的惩罚项ANN是很复杂的模型，非常容易发生过拟合，通用的方法是加入惩罚项，常用的惩罚项有三种：防止过拟合之Dropout在训练模型的每一步中随机暂时剔除一些神经元，在预测时，使用...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。