小白实现Bert(原理+代码详解)
一、什么是Bert
Bert是一种非常出名的预训练模型,在很少数据的情况下也有很好的表现。
参考链接:Bert(一)介绍和使用
1、Bert模型结构
bert训练的两个主要任务是
- 预测被 [mask] 的单词, 相当于完形填空
- 预测输入的两个句子是否相邻
这两个任务就对应了两个损失,因此 bert 是最小化这两个损失函数的和来训练模型的。
2、bert的输入
Bert是一种非常出名的预训练模型,在很少数据的情况下也有很好的表现。
参考链接:Bert(一)介绍和使用
1、Bert模型结构
bert训练的两个主要任务是
这两个任务就对应了两个损失,因此 bert 是最小化这两个损失函数的和来训练模型的。
2、bert的输入