目录 预训练 本节概要 介绍 配置 预训练Bert模型 使用预训练的Bert模型 本节概要 谷歌bert仓库介绍 预训练 本节概要 bert模型是只有编码器的transformer,用于理解语境 谷歌官方基于不同编码器层数和隐藏神经元数提供了不同的模型配置 预训练过程:输入数据-分词-添加CLS和SEP-掩码和预测-三个嵌入层-嵌入值相加得到嵌入向量-bert模型得到特征向量-送入使用softmax的前馈网络层得到预测的掩码或分类概率-多次迭代优化权重 介绍 bert是上下文嵌入模型,先理解语境,然后根据上下