作为一个刚入门深度学习的新手,我在把一个深度学习模型嵌入到另一个大的框架里面时,遇到了这个问题,耗时一天半才解决这个问题
我遇到这个问题是把数据和模型送入gpu和cpu的问题,把原本送入cpu的数据在gpu中计算,才导致上面出现的内存非法占用。我的本意是把模型送入gpu中计算,代码是这样写的
self.modal.device = torch.device('cuda')
但是调试发现,模型输出的数据device显示是在cpu上,所以造成是内存非法占用,然后我把模型送到GPU的语句改成以下语句,解决了错误
self.modal = self.modal.to('cuda')
以上是我解决报错的过程,写的不太专业,各位大佬批评指正。