按照tensorflow的书,在pycharm中写了简单的BP神经网络,然后想要改成手写数字识别的神经网络,按照分批训练、分批测试的思想,最后输出层的结果会是一个多维的tensor。
这里我还是不太熟练tensor的操作,所以,想先算一下每个测试数据的识别结果。
输出层的shape是(10,10),十个测试数据以及每个测试数据在输出层上的十个分类的置信度,需要的是每个测试数据的最大置信度的下标,所以去查了argmax的用法。
看了几篇博客
https://blog.csdn.net/qq575379110/article/details/70538051/
这篇写的挺详细,但是我能明白他说了什么,但是他的语言很容易让人误解,回复里也净是说他“误人子弟”的…
所以,我试着用自己的话,记录一下这个函数的用法,防止以后不熟悉了,找不到资料。
首先,tensorflow的argmax调用了numpy的argmax接口,该方法的意义就是返回指定轴向(axis)的最大值的下标。
所以这里,我用numpy的接口举例,说明一下指定轴向(axis)的意思。
arg= np.array([