1、软件安全实验6.7完成
2、英语未做(准备睡前在床上背一下单词)
3、python
打出了encoder—decoder里简单的encoder
(1)错误地将 df
(数据框)传递给了 AutoTokenizer
,但它不接受数据框作为参数,数据框中的文本数据需要提取成列表或 Series,再传入 tokenizer
进行分词处理。
(2)在read_csv时选择了某列作为索引的话,那么这一列不能按照正常德列来算了,用tolist会报错
(3)
[CLS] 我要 做 事 [SEP] [PAD] [PAD] ...
(4)PyTorch 的 nn.Module
及其子类只接受 torch.Tensor
作为输入
4、要问的问题
(1)分词器选择?