问题
Python的pdb断点调试不能放在pytorch dataset的__getitem__中,不然会报错
但在实际调试的过程中,__getitem__中的内容常常很关键,需要单步调试。
解决
在创建完dataset后,建立如下断点
pdb.set_trace()
dataset[0]
按s进入
就可以发现正好进入到了__getitem__中,之后就可以在通过n或者在getitem中设置其他的断点然后c进行调试了
更新
评论区有大佬提醒:
lifeplayer_: 本质是多线程造成的报错,单线程读取数据就没问题;即dataloader中的num_workers参数为0即可
经验证,修改num_workers后确实不再报错!这样改起来明显更加方便~