深度学习中loss不下降的原因——os.listdir()读取文件无序

masteryi-0018

于 2021-10-26 02:02:45 发布

阅读量359

点赞数 1

分类专栏：深度学习文章标签：深度学习 list linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45510888/article/details/120964162

版权

深度学习专栏收录该内容

12 篇文章 5 订阅

订阅专栏

博客作者在排查深度学习模型训练中loss无法下降的问题时，发现是由于在Linux环境下使用os.listdir()读取数据集时返回的文件顺序与Windows不同，导致样本和标签对应错误。解决办法是确保样本加载的顺序一致性，以避免因平台差异引起的问题。

摘要由CSDN通过智能技术生成

深度学习中loss不下降的原因

其他原因就不赘述了，各种博客讲得很全面，这里记录困扰了我一周多的一个问题。

问题描述

除路径外代码完全相同，在windows下可以正常训练，但是在linux下loss总会收敛到某个值，不能正常训练。

问题原因

由于代码在2个平台的结果不一致，所以分析可能是某些地方的实现在windows和linux的结果不同，追溯之前的代码，进行无数次实验发现，我的dataset类在某次更新之后使用了os.listdir()进行数据的读取，而os.listdir()就是问题的罪魁祸首。

问题解决

经查询，发现os.listdir()在windows和linux的结果确实不同，windows返回的结果是有序的，但是linux返回的结果是无序的，所以造成了样本与标签不对应的情况，于是loss就会停留在一个固定的值。

参考：
踩坑记：Linux下os.listdir()读取文件夹内文件乱序

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。