Tensorflow 进行MNIST手写字体识别中权重初始化问题

最新推荐文章于 2021-11-24 11:11:10 发布

撒哈拉牧码人

最新推荐文章于 2021-11-24 11:11:10 发布

阅读量327

点赞数

分类专栏： Tensorflow学习笔记

本文链接：https://blog.csdn.net/sahalahhh/article/details/104376152

版权

Tensorflow学习笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在对卷积层及池化层进行权重初始化时，
激活函数为 sigmoid 时：

def weight_variable(shape):
    inital = tf.truncated_normal(shape)
    return tf.Variable(inital)

权重初始化为截断正态分布，默认参数如下：

def truncated_normal(shape,
                     mean=0.0,
                     stddev=1.0,
                     dtype=dtypes.float32,
                     seed=None,
                     name=None):

可以看到标准差 stddev 默认为1.0，此时网络可以达到预期的正确率

但当激活函数为 ReLu 时，用标准差为1.0的截断正态分布初始化参数正确率只有10%-20%。
应当设置 stddev=0.1，才可达到预期的正确率

def weight_variable(shape):
    inital = tf.truncated_normal(shape, stddev = 0.1)
    return tf.Variable(inital)

另外，适当的改变优化器的学习率也可优化正确率

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

撒哈拉牧码人

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

tensorflow学习笔记（第一天）-深度卷积神经网络

记忆是一座桥的博客

04-13

5050

一、在这里首先需要了解一些概念性的东西，当然我是才接触，还不太熟悉：1.numpy NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵，比Python自身的嵌套列表（nested list structure)结构要高效的多（该结构也可以用来表示矩阵（matrix））。文档中给出的例子mnist就是以Numpy数组的形式存储着训练、校验和测试数据集.2....

DL之DNN优化技术：自定义MultiLayerNet【5*100+ReLU】对MNIST数据集训练进而比较三种权重初始值（Xavier参数初始化、He参数初始化）性能差异

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

04-10

7651

DL之DNN：自定义MultiLayerNet【5*100+ReLU】对MNIST数据集训练进而比较三种权重初始值性能差异导读 #思路：观察不同的权重初始值(std=0.01、Xavier初始值、He初始值)的赋值进行实验，会在多大程度上影响神经网络的学习。 #结论：std=0.01时完全无法进行学习，是因为正向传播中传递的值很小(集中在0附近的数据)。因此，逆向传播时求到的梯度也很小，权重...

参与评论您还未登录，请先登录后发表或查看评论

mnist数据集及权重参数

02-15

mnist数据集是图像数据，由6万条训练数据和1万条测试数据组成。图像为1通道28像素乘以28像素的灰度图。本压缩文档包含了mnist数据集和神经网络推理的权重参数两个文件

Tensorflow 1.0之后模型文件、权重数值的读取方式

12-20

保存的文件有4个： checkpoint model-parameters.bin-46000.data-00000-of-00001 model-parameters.bin-46000.index model-parameters.bin-46000.meta 读取代码： from tensorflow.python import pywrap_tensorflow with tf.Graph().as_default(): with tf.Session() as sess: ckpt = tf.train.get_checkpoint_state('./checkpoint

Tensorflow 搭建自己的神经网络(二)

aa_JamesJones的博客

11-14

448

卷积神经网络： import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets('MNIST_data',one_hot=True) # 定义Weight变量.其中我们使用tf.truncted_normal产生随机变量来进行初...

Tensorflow训练MNIST手写数字识别模型

09-17

总结来说，这个教程涵盖了构建一个基本的神经网络模型来识别MNIST手写数字的基本步骤，包括定义网络结构、初始化权重、前向传播、损失函数、优化器以及滑动平均。通过学习这个模型，你可以了解深度学习的基本原理，...

基于Tensorflow的MNIST手写数字识别分类

09-16

在本教程中，我们将深入探讨如何使用TensorFlow库进行MNIST手写数字识别。MNIST是一个广泛使用的数据集，包含60,000个训练样本和10,000个测试样本，用于识别0到9之间的手写数字。这个任务是深度学习和机器学习入门的...

Python tensorflow实现mnist手写数字识别示例【非卷积与卷积实现】

09-18

根据提供的文件内容，我将详细阐述在Python中使用TensorFlow实现MNIST手写数字识别的知识点，同时涉及非卷积和卷积两种不同的实现方法。 ### MNIST数据集简介 MNIST是一个包含了手写数字的大型数据库，广泛用于机器...

3用于MNIST的卷积神经网络-3.7学习率与权重初始化对网络性能的影响分析

hongxue8888的博客

11-10

844

原文：http://www.studyai.com/article/73a1d3b70458410e下面我们贴出使用AdamOptimizer优化器时不同的学习率下网络的性能曲线（关于详细分析，请大家到课程中心去听对应的分析） lr=0.0001lr=0.001 lr=0.01 lr=0.1(我们在这个学习率下运行四遍学习过程，由于网络每次的随机起始状态都不一样，所以会得到非常不一样的结果：有时

基于MNIST数据集的不同权重初始值的比较

深度学习领域优质创作者，CSDN博客专家

11-24

1294

通过MNIST数据集的实例，直观感受不同的初始值对神经网络学习的影响。基于标准差分别为0.01，“Xavier初始值”，"He初始值"三个画图。

Tensorflow笔记：MNIST数据集输出手写数字识别准确率

韩明宇

03-27

975

mnist数据集包含 7 万张黑底白字手写数字图片，其中 55000 张为训练集，5000 张为验证集，10000 张为测试集。每张图片大小为 28*28 像素，图片中纯黑色像素值为 0，纯白色像素值为 1。数据集的标签是长度为 10 的一维数组，数组中每个元素索引号表示对应数字出现的概率。 1.使用input_data模块中的read_data_sets()函数加载mnist数据集：...

《TensorFlow 实战》第五章源码 5.2 源代码中权重函数中初始化函数 tf.truncated_normal(shape, stddev=0.1) 中 stddev 的重要性

sdnuwjw的博客

01-09

6102

《TensorFlow 实战》黄文坚黄源著源码地址：https://github.com/sundaygeek/tensorflow-in-action/blob/master/5_2_CNN_MNIST.py def weight_variable(shape): initial = tf.truncated_normal(shape, stddev=0.1) return ...

MNIST数据集使用详解

qq_28840013的博客

07-18

1万+

数据集下载网址：http://yann.lecun.com/exdb/mnist/ 下载后无需解压，将其放在一个文件夹下即可：数据说明：数据集常被分为2~3个部分训练集(train set)：用来学习的一组例子，用来适应分类器的参数[即权重] 验证集(validation set)：一组用于调整分类器参数（即体系结构，而不是权重）的示例，例如选择神经网络中隐藏单元的数量测试集(test ...

使用Tensorflow处理Mnist手写数据集

渴望飞翔的猪

01-09

1560

使用Tensorflow处理Mnist手写数据集 Mnist手写数据集是一个入门级的计算机视觉数据集，何谓入门呢？可以这样说，MNIST 问题就相当于图像处理的 Hello World 程序。下面我将使用Tensorflow搭建CNN卷积神经网络来处理MNIST数据集，来一步步的熟悉Tensorflow和CNN。 MNIST数据集介绍 MNIST数据集是一个手写体数据集，简单说就是一堆这样东西： ...

tensorflow去掉某一维度_如何修复TensorFlow中的维度错误？

weixin_39622980的博客

12-19

217

我试图将教程中的专家部分应用到我自己的数据中，但我一直遇到维度错误。这是导致错误的代码。def weight_variable(shape):initial = tf.truncated_normal(shape, stddev=0.1)return tf.Variable(initial)def bias_variable(shape):initial = tf.constant(0.1, sh...

Torch学习推荐——刘二大人——针对Mnist讲解Torch使用

Mr_DaYang的博客

07-16

2937

梯度的传播降维过程流程神经网络中数据传播过程的定义，防止传错，都写成X active function https://dashee87.github.io/deep%20learning/visualising-activation-functions-in-neural-networks/ 定义dataset，dataloader Example: ...

CNN实现MNIST手写数字识别（C语言和tensorflow分别实现）