现象:我在跑transformer模型的时候,模型跑的很慢,而且可能第一次运行能跑一个batch然后卡了。第二次运行连第一个batch都没跑就卡了。
尝试过程:看了模型和参数都是在GPU上,而且使用 top 命令也不是因为CPU占满。
结果:发现罪魁祸首竟然是tqdm:
换成
模型就开始在GPU上欢快的运行起来啦
现象:我在跑transformer模型的时候,模型跑的很慢,而且可能第一次运行能跑一个batch然后卡了。第二次运行连第一个batch都没跑就卡了。
尝试过程:看了模型和参数都是在GPU上,而且使用 top 命令也不是因为CPU占满。
结果:发现罪魁祸首竟然是tqdm:
换成
模型就开始在GPU上欢快的运行起来啦