根据tensorflow官方教程上的cifar10多gpu版本写了一个训练程序,使用的是自己的图。结果不管如何调节learning rate,总是在训练一定次数之后loss就停止下降了。一开始以为是网络结构的问题,但是换了结构之后还是有相同的问题出现。目前猜测是由于局部最小值的问题。