AMP精读问题
单核训练WaveGlow效果最好. 为什么?
复现单核WaveGlow
用Biao-Bei First版本.
先跑跑看看amp和DDP的情况.
git版本
NV_GPU='7' nvidia-docker run --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 -it --rm --ipc=host -v $PWD:/workspace/tacotron2/ tacotron2 bash
代码输出:
#########amp: True
---1111--DDP: wheather: False
怀疑DDP降低了精度.
不清楚torch的DDP_sampler和这个区别, 不想涉及这个问题. 不如黑盒尝试. 选择单核跑很久.
单核重新训练
直接用已有的Biao-Bei_PPC版本.
git版本
训练LJS WG
oneCore_
训练BB WG
oneCore_
训练BB T-2
oneCore_
记得, 还有benchmark, loadDisk,o1,2,3 等没用呢.