GPT,ELMo,和BERT关联,理解 文章推荐: 网页链接 https://zhuanlan.zhihu.com/p/49271699 BERT用transformer方法取代了ELMo中用LSTM提取特征的方法BERT解决了GPT中单向语言模型的方法,变为双向。BERT采用了Fine tuning方式