神经网络参数迁移与惯性质量

(0,1)-81*10*2-(1,0)(0,1)

作一个二分类网络分类mnist的0和1,但用这个网络来分类其他对象,比如(0,2),(0,3),(0,4),实现参数迁移。这种操作是否有什么物理意义?

 

通过固定收敛标准多次测量取平均值的办法计算这个网络分类02,03,04的分类准确率,

得到表格

 *01*01*01
 *02*03*04
δ平均准确率p-ave平均准确率p-ave平均准确率p-ave
0.50.5123530.5121210.506664
0.40.6279110.6039240.622176
0.30.6735490.6627840.654716
0.20.7126760.688690.682039
0.10.6925480.6690010.651714
0.010.7304910.7136410.668127
0.0010.7231790.7122270.64577
9.00E-040.7180810.7063660.63909
8.00E-040.716870.7070.634211
7.00E-040.7222140.7142090.636247
6.00E-040.7337330.7262440.648851
5.00E-040.7466410.7451530.65918
4.00E-040.7522550.7530490.661081
3.00E-040.739620.7382670.648764
2.00E-040.7270320.7028180.620956
1.00E-040.7466460.7435340.620877
9.00E-050.7478750.7455060.61798
8.00E-050.7465860.7441350.616631
7.00E-050.7447850.7451530.615163
6.00E-050.7454020.7474630.6092
5.00E-050.7486340.753430.608076
4.00E-050.7524130.7581320.604534
3.00E-050.7536410.7446050.59986
2.00E-050.7494760.7306230.592132
1.00E-050.7387910.685750.579265

把分类准确率画成图

平均分类准确率Pave  02>03>04

按照假设2

对应不同的两个对象,迭代次数越大,二者的相对速度越大;相对速度越大分类准确率越大。

 

比如当收敛标准为1e-5的,02的分类准确率为0.738,04的分类准确率为0.579.按照假设2,可以得出02粒子对的相对速度>04粒子对的相对速度。

因为收敛标准是一样的,可以合理假设对这两个粒子对做的功是一样的。因此可以得出02粒子对的质量<04粒子对的质量。

 

也就是分类准确率越大粒子对质量越小。

因此可以假设网络(0,1)-81*10*2-(1,0)(0,1)构成的分类场形成了一个惯性系统,参数迁移相当于测量其他对象在这个惯性系统里的惯性质量。

就像不同质量的人在电梯里,当电梯上升时感受到的力应该是不同的。

 

从形态上看4和1最像,2和1的形态差异最大。因此4和1的波函数的等效交叉程度最大,所以粒子对02,03,04在01的惯性系中拥有的惯性质量顺序04>03>02.

或者至少用惯性质量解释参数迁移这件事是逻辑连贯的。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黑榆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值