1. T5的起始符是<pad>,id是0。终止符是<eos>,id是1.
2.下面这行代码,默认是把两条文本补齐到一样的长度,padding和truncation都必须是True,否则实现不了补齐。
input_ids = tokenizer([text1, text2],
return_tensors='pt',
padding=True ,
truncation=True
).input_ids.to(device)
3. T5在model.train()模式下,每次生成的内容都会不一样。在model.eval()模式下每次生成的内容是相同的。
即使是model.train+torch.no_grad()也还是每次内容都不一样。