input_ids是把词根据词表转换为数字,长度没有达到max_seq_len使用0填充。
input_mask 填充的为0,真实数据长度为1.
segment_ids 这个是因为BERT有的是可以使用句子的下一个句子来一起训练,所以是来分别句子类别的,第一个句子全为0,第二个句子则为1.
label_ids就是你需要的label这个自己设置。
11-03
514
04-17
4188
input_ids是把词根据词表转换为数字,长度没有达到max_seq_len使用0填充。
input_mask 填充的为0,真实数据长度为1.
segment_ids 这个是因为BERT有的是可以使用句子的下一个句子来一起训练,所以是来分别句子类别的,第一个句子全为0,第二个句子则为1.
label_ids就是你需要的label这个自己设置。