Tensorflow实现多层感知机Multi-layer Preceptron

# coding:utf-8
'''
使用Tensorflow训练神经网络的4个步骤
①定义算法公式 即神经网络的forward时的计算
②定义损失函数和选择优化器来优化loss
③训练步骤
④对模型进行准确率评测

隐含层:解决XOR问题
神经网络的隐藏层越多就可以对原特征进行越抽象的变换 模型的拟合能力越强

Tensorflow实现多层感知机Multi-layer Preceptron
'''

from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf 

mnist = input_data.read_data_sets('MNIST_data/', one_hot=True)
# 创建一个Tensorlfow默认的session 后面的操作就无需指定Session
sess = tf.InteractiveSession()

in_units = 784
h1_units = 300
# 将权重初始化为截断的正态分布 标准差为0.1 正态分布给参数加一些噪声 打破完全对称且避免0梯度
w1 = tf.Variable(tf.truncated_normal([in_units, h1_units], stddev=0.1))
b1 = tf.Variable(tf.zeros([h1_units]), dtype=tf.float32)
w2 = tf.Variable(tf.zeros([h1_units,10]), dtype=tf.float32)
b2 = tf.Variable(tf.zeros([10]), dtype=tf.float32)

x = tf.placeholder(tf.float32, [None, in_units])
keep_prob = tf.placeholder(tf.float32) #dropout的比率 通常训练小于1 测试等于1

# 定义模型结构
hidden1 = tf.nn.relu(tf.matmul(x, w1) + b1) #激活函数为relu的隐藏层
hidden1_drop = tf.nn.dropout(hidden1, keep_prob) #dropout防止过拟合
y = tf.nn.softmax(tf.matmul(hidden1_drop, w2) + b2) #softmax输出层

# 定义损失函数和选择优化器来优化loss
y_ = tf.placeholder(tf.float32, [None,10])
cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1])) #交叉熵
train_step = tf.train.AdagradOptimizer(0.3).minimize(cross_entropy)

# 训练步骤
tf.global_variables_initializer().run()
for i in range(3000):
	batch_xs, batch_ys = mnist.train.next_batch(100)
	train_step.run({x:batch_xs, y_:batch_ys, keep_prob:0.75})

# 对模型进行准确率评测
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
print(accuracy.eval({x:mnist.test.images, y_:mnist.test.labels, keep_prob:1.0}))


没有隐含层的softmax regression只能直接从图像的像素点推断是哪个数字,没有特征抽象的过程。

多层神经网络依靠隐含层,可以组合高阶特征



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
多层人工神经网络也叫做多层感知机(MLP,multi-layer perceptron),是一种常用的深度学习模型。它由多个神经元组成的神经网络,其中神经元按照层次排列,每一层的神经元通过连接权重与前一层的神经元进行信息传递。 在多层感知机中,通常有一个输入层、若干个隐藏层和一个输出层。输入层接收外部输入数据,隐藏层和输出层对输入数据进行加工和处理,输出层则给出最终的预测结果。每个神经元都有一个激活函数,用于对输入信号进行非线性转换。 多层感知机的训练过程一般使用反向传播算法。首先,通过将训练数据输入网络,根据当前网络参数计算得到输出结果;然后,通过与真实标签比较,计算出误差;最后,根据误差反向传播更新网络参数,以减小误差。这个过程重复进行多次,直到网络的输出结果与真实标签达到较好的匹配。 多层感知机的优势在于可以通过增加隐藏层的深度来提高模型的复杂度和表达能力,从而更好地拟合非线性关系。而激活函数的选择也影响着模型的性能,常用的激活函数有ReLU、Sigmoid和tanh等。 总结而言,多层人工神经网络(多层感知机)是一种有效的深度学习模型,通过反向传播算法进行训练,能够应对更加复杂的非线性关系。在实际应用中,多层感知机被广泛应用于图像识别、自然语言处理、语音识别等领域,并取得了很多显著的成果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值