(A,B)-n*m*2-(1,0)(0,1)
设一个二分类的网络来分类两个粒子A和B。将A和B对应的训练集XA和XB理解成是表达A和B运动状态的哈密顿量。网络收敛得到的权重w看作波函数Ψ。
如果将收敛标准理解成是能量E的一种外部表征,神经网络的收敛就是计算A和B的本征函数Ψ的过程。如果把波函数Ψ理解成是轨道这个网络就相当于在计算粒子A和B相互作用的轨道。对应同一个收敛标准可能会有多个收敛迭代次数,也就是对应同一个本征值E可能会有多个本征函数的简并解。
很难假设像mnist数据集的0或者1的图片中携带了关于粒子电量和自旋的信息,粒子A和B极有可能是不带电的标量子,按照物质波的理论,假设这两个粒子有质量是合理的。这样不管这两个粒子或物体之间是否还有别的力,他们之间有引力是大概率的。
网络对粒子A在(1,0)位的分类准确率是PA,网络在(0,1)对B的分类准确率是PB。
PA+PB=2*P ,P网络的整体分类准确率。将PA理解成是粒子A在(1,0)位存在的概率,同样将PB理解成是粒子B在(0,1)存在的概率。神经网络的分类过程就是让两个粒子在两个位置出现的概率不断变大并不断接近1的过程。
神经网络不就是在解这个方程吗?