TensorFlow定义隐藏层的方法

最近在学习TensorFlow,跟着教程敲了很多代码,但是也只是仅仅跟着敲,虽然也写过简单的隐藏层,但是真正要自己敲一个隐藏层还是感觉一脸懵逼,于是就有了这篇简短的博客。

初学者在写隐藏层的时候通常会遇到以下两个疑问:

  • 不知道如何设置张量的维度
  • 不知道该选什么激活函数
设置隐藏层维度

观察下面这段关于mnist手写识别数字的代码:

# 第二步、定义神经网络模型
# 输入层
x = tf.placeholder(tf.float32, [None, 784])
y = tf.placeholder(tf.float32, [None, 10])

# ///隐藏层//
w1 = tf.Variable(tf.truncated_normal([784, 500], stddev=0.1))
b1 = tf.Variable(tf.zeros([500]))
L1 = tf.nn.relu(tf.matmul(x, w1) + b1)

w2 = tf.Variable(tf.truncated_normal([500, 300], stddev=0.1))
b2 = tf.Variable(tf.zeros([300]))
L2 = tf.nn.relu(tf.matmul(L1, w2) + b2)
# ///隐藏层//

# 输出层
w3 = tf.Variable(tf.truncated_normal([300, 10], stddev=0.1))
b3 = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(L2, w3)+b3)

上面这段代码中,输入层是一个n行784列的张量;紧接着我们的第一层隐藏层的权重w1行数就变成了784,列数我们可以自己定义,我这里定义为500;第二个隐藏层w2的行数又等于上一个隐藏层的列数500,行数也是自定义为300;到了输出层w3则行数为300,输出必定为10,因为我们要预测的是0到9的数字。此外,偏置值b必定等于列数。
如果你无法理解以上的内容,你可以参照矩阵的乘法。在矩阵的乘法里,两个相乘的矩阵必须乘数的列数等于另一个乘数的行数,要不然矩阵乘法不成立。

设置激活函数

这里主要区分一下激活函数的作用,到时候选用的时候对照着就可以了,softmax一般放在输出层:

  • ReLU - 用于隐层神经元输出
  • tanh- 用于隐层神经元输出
  • Sigmoid - 用于隐层神经元输出
  • Softmax - 用于多分类神经网络输出
  • Linear - 用于回归神经网络输出(或二分类问题)

结束线/

欢迎大家加入Q群讨论:463255841

结束线/

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值