<UNK>: 低频词或未在词表中的词<PAD>: 补全字符<GO>/<SOS>: 句子起始标识符<EOS>: 句子结束标识符[SEP]:两个句子之间的分隔符[MASK]:填充被掩盖掉的字符 Bert标识符 [CLS]:句子开头,以[CLS]开头,随后跟句子的第一个单词