MNIST数据集
MNIST数据集的官网是Yann LeCun’s website
mnist数据集的导入的代码:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
实现Softmax回归模型
softmax模型可以用来给不同的对象分配概率。
softmax回归分两步:
1)对输入被分类对象属于某个类的“证据”相加求和,然后将这个“证据”的和转化为概率。即:我们对图片像素值进行加权求和。如果这个像素具有很强的证据说明这张图片不属于该类,那么相应的权值为负数,相反如果这个像素拥有有利的证据支持这张图片属于这个类,那么权值是正数。
2)将各像素点权值累加归一化处理,是和为1,满足概率分布。
使用tensorflow前先导入它
import tensorflow as tf
一个Variable代表一个可修改的张量,存在在 TensorFlow 的用于描述交互性操作的图中.它们可以用于计算输入值,也可以在计算中被修改.对于各种机器学习应用,一般都会有模型参数,可以用Variable表示。
x = tf.placeholder("float", [None, 784])
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
实现模型:
y=tf.nn.softmax(tf.matmul(x,W)+b)
为了计算交叉熵,我们首先需要添加一个新的占位符用于输入正确值:
y=tf.placeholder("float",[None,10])
计算交叉熵:
cross_entropy = -tf.reduce_sum(y_*tf.log(y))
使用梯度下降算法(gradient descent algorithm)以 0.01的学习速率最小化交叉熵.
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)
初始化创建的变量:
init = tf.initialize_all_variables()
在Session里面启动我们的模型
sess=tf.Session()
sess.run(init)
开始训练我们的模型,在该循环的每个步骤中,我们都会随机抓取训练数据中的 100 个批处理数据点,然后我们用这些数据点作为参数替换之前的占位符来运行train_step
for i in range(1000):
batch_xs, batch_ys = mnist.train.next_batch(100)
sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})
检测预测的数据与真实的数据是否匹配:
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction , "float"))
print (sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))