在cifar100上运行disco相关代码报错及解决

shadow fish

已于 2022-09-12 09:18:47 修改

阅读量817

点赞数

分类专栏：深度学习文章标签：深度学习 python 人工智能

于 2022-09-10 21:11:32 首次发布

本文链接：https://blog.csdn.net/qq_45862085/article/details/126794696

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

简介

disco是一种知识蒸馏的新方案，通过假定MLP层包含最丰富的特征，从teacher模型的MLP层蒸馏知识，训练轻量级的student模型
代码地址

报错一

ImportError: cannot import name ‘container_abcs‘ from ‘torch._six‘
解决
原因分析：由于colab中预装的pytorch版本与项目需要的pytorch版本不一致问题

报错二

没有找到flocal module
解决：

from data.cal_mi import cal_mi_epoch
from data.mi_by_binning import MI_cal_v2

原因分析：通过检索全局文件发现cal_mi mi_by_binning在data目录下

报错三

没有找到no checkpoint found at ‘/ckpt/ResNet50-checkpoint_0199.pth.tar’
改成./ckpt
原因分析，git下的代码不在根目录一级下，需要使用相对路径

报错四

Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm)
出现这个错误的情况是，在服务器上的docker中运行训练代码时，batch size设置得过大，shared memory不够（因为docker限制了shm）.解决方法是，将Dataloader的num_workers设置为0.