TensorFlow入门-MNIST & softmax regression

环境:win7 64位 Anaconda(python3.5)-TensorFlow

安装好TensorFlow后,参考TenforFlow官方教程开始学习。此文为使用MNIST数字集训练softmax regression,实现数字识别。

1. MNIST简介

MNIST放在Yann LeCun的网站上。

每张图像是28*28,将图像拉伸成一维的,就是有28*28=784的数字的向量。将图像拉伸成一维的,会损失2维结构信息。

训练图像55,000张,所以mnist.train.images是个[55000,784]的矩阵。
验证图像有5,000张,所以mnist.validation.images是[5000,784]。
测试图像10,000张。每个像素值在0-1之间。

因为数字在0-9之间,共有10类。图像的标签采用one-hot方式。比如3对应[0,0,1,0,0,0,0,0,0,0]。
训练图像对应的labels,mnist.train.labels就是[55,000,10]的矩阵。

2.代码解读

1.下载读取MNIST数据

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

数据下载到了C:\Users\Administrator\MNIST_data中。

2.导入TensorFlow

import tensorflow as tf

3.创建模型

softmax regression中计算预测值的公式是y=softmax(W*x+b),所以要定义W,x,b和y。

x = tf.placeholder(tf.float32, [None, 784])
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
y = tf.matmul(x, W) + b

x是一个placeholder(占位符),当我们要求TensorFlow运行一个计算时
会输入它。tf.float32是数据类型,[None,784]指数据维度,因为图像数量可任意选择,所以用None。

W,b定义为Variable,初始为0。

计算y时,为了让维度对应,将x,W调换顺序。

4.定义损失函数和优化策略

labels对应的y_

 y_ = tf.placeholder(tf.float32, [None, 10])

损失函数使用交叉熵(cross-entropy)用了内置的计算cross-entropy的函数。
这里写图片描述

cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(y, y_))

optimizer用Gradient Densent, learning rate设置为0.5。

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

5.训练

先用个session对象初始化变量

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

每个batch为100的SGD

for i in range(1000):
  batch_xs, batch_ys = mnist.train.next_batch(100)
  sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

6. 模型评估

用tf.argmax(y,1)函数返回预测结果中沿着一个轴(axis)的最大值的索引(index),即预测的类别。用tf.equal检查预测值与真实值是否相等。

correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))

correct_prediction是一个布尔值列表,类似于 [True, False, True, True] ,将其转化为[1,0,1,1],即可计算准确度accuracy。

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

精度是91%。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本文将介绍如何使用softmax回归对Fashion-MNIST图像数据集进行预测。 Fashion-MNIST是一个替代MNIST手写数字集的图像数据集,用于训练和测试机器学习模型。它包含了10个类别的70,000张灰度图像,每个图像的大小为28x28像素。这些图像涵盖了从衣服、鞋子到手提包等各种物品。 为了使用softmax回归对Fashion-MNIST图像数据集进行预测,我们需要完成以下步骤: 1.加载Fashion-MNIST数据集 首先,我们需要下载并加载Fashion-MNIST数据集。可以使用以下代码块下载和加载数据集: ``` import tensorflow as tf from tensorflow import keras (x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data() ``` 2.预处理数据集 接下来,我们需要对数据集进行预处理。我们需要将每个图像的像素值缩放到0到1之间,并将标签转换为独热编码。可以使用以下代码块完成预处理: ``` x_train = x_train.astype('float32') / 255.0 x_test = x_test.astype('float32') / 255.0 y_train = keras.utils.to_categorical(y_train) y_test = keras.utils.to_categorical(y_test) ``` 3.构建模型 接下来,我们需要构建一个softmax回归模型。我们可以使用一个全连接层作为模型的唯一层,并将softmax函数应用于输出。可以使用以下代码块构建模型: ``` model = keras.Sequential([ keras.layers.Flatten(input_shape=(28, 28)), keras.layers.Dense(10, activation='softmax') ]) ``` 4.编译模型 接下来,我们需要编译模型。我们可以使用categorical_crossentropy作为损失函数,并使用adam优化器进行优化。可以使用以下代码块编译模型: ``` model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) ``` 5.训练模型 接下来,我们需要训练模型。我们可以使用fit方法来训练模型,并指定训练数据、批量大小、训练迭代次数和验证数据。可以使用以下代码块训练模型: ``` model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test)) ``` 6.评估模型 最后,我们需要评估模型。我们可以使用evaluate方法来评估模型,并指定测试数据。可以使用以下代码块评估模型: ``` loss, accuracy = model.evaluate(x_test, y_test) print('Test accuracy:', accuracy) ``` 完整代码如下: ``` import tensorflow as tf from tensorflow import keras (x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data() x_train = x_train.astype('float32') / 255.0 x_test = x_test.astype('float32') / 255.0 y_train = keras.utils.to_categorical(y_train) y_test = keras.utils.to_categorical(y_test) model = keras.Sequential([ keras.layers.Flatten(input_shape=(28, 28)), keras.layers.Dense(10, activation='softmax') ]) model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test)) loss, accuracy = model.evaluate(x_test, y_test) print('Test accuracy:', accuracy) ``` 通过以上步骤,我们就可以使用softmax回归对Fashion-MNIST图像数据集进行预测。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值