这个问题遇到了,一定要记录一下:
解决方案参考:https://blog.csdn.net/m0_52347246/article/details/120176728
问题出现原因:
出现这个原因主要就是因为view()需要Tensor中的元素地址是连续的,因为可能出现Tensor不连续的情况,所以需要写代码的时候人为保持连续。
这个原来的代码是:
return self.weights[device].index_select(0, positions.view(-1)).view(bsz, seq_len, -1).detach()
在view前加入: contiguous()
return self.weights[device].index_select(0, positions.contiguous().view(-1)).contiguous().view(bsz, seq_len, -1).detach()