一、先理清「技术家谱」:BERT和Transformer是啥关系?
就像「包子」和「面食」的关系——BERT是「Transformer家族」的「明星成员」,而GPT、Qwen、DeepSeek这些大模型则是「Transformer家族」的「超级后辈」。
1.1 BERT:Transformer的「双向强化版」
- 就像:把普通外卖骑手(原始Transformer)训练成「全局路况通」,能同时看到订单的「历史记录」和「当前状态」。
- 技术特点
就像「包子」和「面食」的关系——BERT是「Transformer家族」的「明星成员」,而GPT、Qwen、DeepSeek这些大模型则是「Transformer家族」的「超级后辈」。