TypeError: TextEncodeInput must be Union[TextInputSequence, Tuple[InputSequence, InputSequence]]
使用AutoTokenizer.encode方法,单独句子不能放在列表或者元组中传入。。输入只有一条句子的列表,会出现这种错误:
tokens = tokenizer.encode(['窗前明月光'])
print(tokens) # 报错
AutoTokenizer.encode的输入有三种:单独句子,列表多个句子,元组多个句子
tokens = tokenizer.encode('床前明月光')
tokens = tokenizer.encode(['床前明月光', '疑是地上霜'])
tokens = tokenizer.encode(('床前明月光', '疑是地上霜'))