Error 1.
Torch.utils.datasets
和huggingface的datasets
是不一样的
Error 2. cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
准确来说,这不是Hugging face的问题,是我在使用Torch时遇到的问题,现在也收集其中
出现的原因主要时CUDA runtime version不合适,解决方案参考帖子:
pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
Error 3. vars() argument must have dict attribute?
这个问题出现的原因多半是因为使用了自定义的dataset,但是在训练模型的时候没有传入相对于的data_collator
问题代码如下:
encoded_texts = tokenizer(texts, padding = True, truncation = True, return_tensors = 'pt')
labels = torch.tensor(labels)
dataset = TensorDataset(encoded_texts['input_ids'], encoded_texts[<