T5 使用记录

Uranus-。

已于 2024-06-26 10:55:14 修改

阅读量355

点赞数 7

文章标签：深度学习自然语言处理

于 2024-06-20 21:19:41 首次发布

本文链接：https://blog.csdn.net/qq_21366993/article/details/139842933

版权

1. T5的起始符是<pad>，id是0。终止符是<eos>，id是1.

2.下面这行代码，默认是把两条文本补齐到一样的长度，padding和truncation都必须是True，否则实现不了补齐。

input_ids = tokenizer([text1, text2], 
                    return_tensors='pt',
                    padding=True ,
                    truncation=True
                    ).input_ids.to(device)

3. T5在model.train()模式下，每次生成的内容都会不一样。在model.eval()模式下每次生成的内容是相同的。

即使是model.train+torch.no_grad()也还是每次内容都不一样。