训练代码
参加的 天池-中文预训练模型泛化能力挑战赛 ,根据Datawhale提供的代码,在自己的机器上跑一遍训练流程。
准备阶段
代码下载
clone 下来代码,通过Pycharm打开项目。
环境配置
根据readme中的提示,下载 Pytorch,transformers,sklearn。
在之后的代码运行中,遇到了Pytorch版本不匹配的问题。我才开始安装的是 1.1.0,不行后面又安装的1.2.0,也不行。但是我的CUDA版本为10.0,只能支持到1.2.0,所以又把CUDA升级到10.1,安装的Pytorch 1.6.0。
感觉在以后运行课题项目代码的时候又要把CUDA安装到10.0版本(版本问题太坑了-.-)
代码运行
因为我的机器配置太低,所以在开始运行的时候我把 batchSize改成了 8 ,但是还是不行,之后改成了4也不行(显卡内存太少了),最后改成了2 ,可以运行了。
而且为了第一遍熟悉流程,把 epochs 改