input_ids是把词根据词表转换为数字,长度没有达到max_seq_len使用0填充。
input_mask 填充的为0,真实数据长度为1.
segment_ids 这个是因为BERT有的是可以使用句子的下一个句子来一起训练,所以是来分别句子类别的,第一个句子全为0,第二个句子则为1.
label_ids就是你需要的label这个自己设置。
bert参数解析
最新推荐文章于 2024-05-11 19:23:38 发布
input_ids是把词根据词表转换为数字,长度没有达到max_seq_len使用0填充。
input_mask 填充的为0,真实数据长度为1.
segment_ids 这个是因为BERT有的是可以使用句子的下一个句子来一起训练,所以是来分别句子类别的,第一个句子全为0,第二个句子则为1.
label_ids就是你需要的label这个自己设置。