BNB 网络缝合Revisiting Model Stitching to Compare Neural Representations

文章探讨了模型缝合技术在比较神经网络内部表示方面的应用,指出其优于现有中心核对齐(CKA)方法。通过实验,证明相同结构的网络,即使采用不同训练方法,也能通过缝合保持效果。此外,更大、训练时间更长的网络更容易缝合,并揭示了随机梯度下降的结构性质——缝合连通性。
摘要由CSDN通过智能技术生成

读NIPS2021论文 Revisiting Model Stitching to Compare Neural Representations

目录

摘要

配图

局限

未来工作


摘要

文章重新研究和扩展了model stitching方法,来研究神经网络的内部representation。给定两个已经训练好的参数已固定的网络A和B,作者考虑这样一种stitched model:将A的bottom layer和B的top layers缝合在一起组成一个新的模型。作者认为stitching是一个强大的且被低估的工具,效果在一些方面胜过目前的类似center kernel algnment (CKA)。通过实验,作者利用stitching来得到量化“好网络学到相似的表示”的验证。同样结构的网络,通过不同训练方法如监督、自监督学到的模型可以缝合在一起而不引起效果下降。作者还要说明了“more is better”,通过缝合(1) 更多数据的网络(2)更大的网络(3)训练时间更长的网络。最后,文中的实验表明stitching揭示了随机梯度下降的一个结构性质,即stitching connectivity,通过随机梯度下降得到的典型的局部最小值可以互相缝合。

配图

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值