最近在刷强化学习,做经验回放的时候发现自己竟然暴了内存,经过检查发现是np.random.choice(len(buffer), 128, replace=False)这行代码有问题。
这行代码的功能是随机索引我数据缓冲区的数据作为训练数据,按理来说只是生成个随机数,生成完了就没用了,但是这行代码会不停的申请内存,不释放,最后导致内存耗尽,让进程彻底完蛋。
最近在刷强化学习,做经验回放的时候发现自己竟然暴了内存,经过检查发现是np.random.choice(len(buffer), 128, replace=False)这行代码有问题。
这行代码的功能是随机索引我数据缓冲区的数据作为训练数据,按理来说只是生成个随机数,生成完了就没用了,但是这行代码会不停的申请内存,不释放,最后导致内存耗尽,让进程彻底完蛋。