论文阅读:What Do Neural Networks Learn When Trained With Random Labels?

最新推荐文章于 2024-07-31 14:30:10 发布

一线之隔

最新推荐文章于 2024-07-31 14:30:10 发布

阅读量347

点赞数

分类专栏： paper 文章标签： python 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44622669/article/details/121564206

版权

paper 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

What Do Neural Networks Learn When Trained With Random Labels?

Abstract
Introduction
- - - 1.1 example
Covariance matrix alignment between network parameters and data

When Trained With Random Labels?)
内容整理自 What Do Neural Networks Learn
When Trained With Random Labels?.

Abstract

an alignment between the principal components of network parameters and data takes place when training with random labels.神经网络参数会和数据的主要成分进行对齐

Introduction

过参数化：网络有较多的参数。 motivation：
over-parameterization helps DNNs to interpolate any set of random labels有利于插入任何一组数据，但是DNN从中学习到了什么？
其他工作：随机标签的负面作用(噪声)
作者工作：随机标签下学到何种数据分布？
contribution：
- 随机标签的影响(积极+消极)
- 发现发生参数与数据的对齐。

1.1 example

upstream and downstream: 同规模的上游随机训练可以加快下游任务
the principal components of weights at the first layer are aligned with the principal components of data.神经网络第一层会与数据集的主成分对齐

Covariance matrix alignment between network parameters and data

2.1 Preliminaries

定义对齐(Alignment)
A symmetric matrix A is said to be aligned with a symmetric matrix B if each eigenspace of B is a subset of an eigenspace of A.即B的每个特征空间都被A包含

2.2 Alignment for centered Gaussian inputs

对于各向同性噪声，
(1) E[w] = 0
(2) Σw = E[w · wT ]权重与数据Σx 的协方差矩阵对齐
For two positive definite matrices A, B, the “misalignment” M(A, B) is defined as
(个人理解即不对齐的程度)
作者给出实验验证
- 不同情况下misalignment的结果
  
  可以发现使用特征向量时，随机标签与真实标签的misalignment几乎是一致的，且处于较低的水平，且随机偏差misalignment升高。说明不管标签如何，第一层过滤器与数据之间是有对齐的
- v_w为权重特征向量，v_x为数据特征向量左：二者基本一致
  右：v_x与某个特征向量加权后可以得到v_w
2.2节作者具体说明了对齐效应是什么，并给出一定的实验可视化演示和对比，很容易联想到神经网络的浅层学习到的知识是以数据特征为主的知识，

2.3 Mapping of eigenvalues(没太理解具体内容)

对于 Σx，设v_i长度为1，特征值为 $\sigma$ _i².如果 Σw 与 Σx 对齐，v_i也是 Σw 的特征向量，且可以计算得到其特征向量
定义从 Σx 到 Σw 的传递函数f：
定义了数据特征值 $\sigma$ _i²和特征向量v_i转化为权重特征的过程

2.4 Covariance alignment and eigenvalue mapping explains positive transfer experimentally && Deeper layers

给定一个网络的训练数据 -> 第一层网络的二阶统计数据
深层神经网络可以迁移此方法进行迭代(在123层表现较好)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文阅读:What Do Neural Networks Learn When Trained With Random Labels?

What Do Neural Networks LearnWhen Trained With Random Labels?AbstractWhen Trained With Random Labels?)内容整理自What Do Neural Networks LearnWhen Trained With Random Labels?.Abstractan alignment between the principal components of network parameters and
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。