#Mnist数据集逻辑回归分类任务
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
#one_hot=True 表示对label进行one-hot编码,比如标签4可表示为[0,0,0,0,1,0,0,0,0,0,0]
mnist = input_data.read_data_sets('data/',one_hot=True)
#设置参数
numClasses = 10 #输出类别个数
inputSize = 784 #输入图片像素 28*28*1
#用梯度下降做
trainingIterations = 50000 #迭代次数
batchSize = 64 #一次迭代的个数
#指定好x y的大小 指定成placeholder格式 方便进行计算
X = tf.placeholder(tf.float32,shape = [None,inputSize]) #输入的数据 None:意思为任意大小的数据量
y = tf.placeholder(tf.float32,shape = [None,numClasses]) #标签 输入类别的个数 0-9的one-hot编码
placeholder格式:
函数定义:tf.placeholder(dtype,shape=None,name=None)
参数:
dype:数据类型。如tf.int32,tf.float32,tf.float64,tf.string等
shape:数据形状。默认为None,即一维值,也可表示多维,如:[None,inputSize]表示为inputSize列 行不定,任意大小
name:名字
返回:Tensor类型
#参数初始化
W1 = tf.Variable(tf.random_normal([inputSize,numClasses],stddev=0.1)) #784*10
B1 = tf.Variable(tf.constant(0.1),[numClasses])
tf.random_normal(shape,mean=0.0,stddev=1.0,dtype=tf.float32,seed=None,name=None)
用于从服从正太分布的数值中取出指定个数的值。
shape:输出张量的形状
mean:正态分布的均值
stddev:正态分布的标准差
dtype:输出的类型
seed:随机数种子
name:操作的名称
偏置大小与结果的维数一直,此时结果为10,所以b也是10维。
#构造模型 需要有预测值
#预测值
y_pred = tf.nn.softmax(tf.matmul(X,W1) + B1) #每个类别的概率值
#损失值
loss = tf.reduce_mean(tf.square(y - y_pred))
opt = tf.train.GradientDescentOptimizer(learning_rate = .05).minimize(loss)
#预测值与真实值是否一样 根据最大位置(1)是否相同判断 argmax函数:能给出某个tensor对象在某一维上
#的其数据最大值所在的索引值,
correct_prediction = tf.equal(tf.argmax(y_pred,1),tf.argmax(y,1))
#精度值
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)
tf.argmax(input,axis=None,name=None,dimension=None) 对输入的矩阵按照行或列计算最大值
input:输入的矩阵
axis:0表示列,1表示行
返回值:行或列的最大值下标向量
tf.cast(x,dtype,name=None)
将x的数据格式转化成dtype数据类型,如原来x的数据格式是bool,转化成float后,就能将其转化成0,1序列。
#迭代计算
for i in range(trainingIterations):
batch = mnist.train.next_batch(batchSize) #用数据集中自带函数取batch数据
batchInput = batch[0] #x
batchLabels = batch[1] #y
#执行迭代
_,trainingLoss = sess.run([opt,loss],feed_dict={X:batchInput,y:batchLabels})
if i%1000 == 0:
#计算当前的精度值
train_accuracy = accuracy.eval(session = sess,feed_dict={X:batchInput,y:batchLabels})
print("step %d, train accuracy %g" %(i,train_accuracy))
#测试结果
batch = mnist.test.next_batch(batchSize)
testAccuracy = sess.run(accuracy,feed_dict={X:batch[0],y:batch[1]})
print("test accuracy %g" %(testAccuracy))