bert本质上提供了一个词
1.token进行分词
2.token convert-id()输出每个词的id
3.attentionmask 进行mask
4.bert的不同层的输出效果不一样
[cls]向量用来做分类任务
hidden-state 向量可以用来做实体识别
bert本质上提供了一个词
1.token进行分词
2.token convert-id()输出每个词的id
3.attentionmask 进行mask
4.bert的不同层的输出效果不一样
[cls]向量用来做分类任务
hidden-state 向量可以用来做实体识别