softmax_cross_entropy_with_logits函数
tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 除去name参数用以指定该操作的name,与方法有关的一共两个参数:
第一个参数logits:就是神经网络最后一层的输出,如果有batch的话,它的大小就是[batchsize,num_classes],单样本的话,大小就是num_classes
第二个参数labels:实际的标签,大小同上
具体的执行流程大概分为两步:
第一步是先对网络最后一层的输出做一个softmax,这一步通常是求取输出属于某一类的概率,对于单样本而言,输出就是一个num_classes大小的向量([Y1,Y2,Y3…]其中Y1,Y2,Y3…分别代表了是属于该类的概率)
第二步是softmax的输出向量[Y1,Y2,Y3…]和样本的实际标签做一个交叉熵(即分类与向量的乘积),交叉熵是一个向量。
第三步再做一步tf.reduce_sum操作,就是对向量里面所有元素求和,最后才得到,如果求loss,则要做一步tf.reduce_mean操作,对向量求均值!
import tensorflow as tf
logit=tf.constant([[1.0,2.0,3.0],[1.0,2.0,3.0],[1.0,2.0,3.0]])
y=tf.nn.softmax(logit)
y_=tf.constant([[0.0,0.0,1.0],[0.0,0.0,1.0],[0.0,0.0,1.0]])
cross_entropy =-tf.reduce_sum(y_*tf.log(y))
cross_entropy2=tf.reduce_sum(tf.nn.softmax_cross_entropy_with_logits(logits=logit,labels=y_))
with tf.Session() as sess:
softmax=sess.run(y)
c_e=sess.run(cross_entropy)
c_e2=sess.run(cross_entropy2)
print(softmax)
print(c_e)
print(c_e2)
print(sess.run(tf.log(y)))`