自回归语言模型 VS 自编码语言模型 - 知乎
关于transformer-xl和xlnet以及tensorflow的知识简要小结_weixin_41710583的博客-CSDN博客
关于transformer-xl和xlnet以及tensorflow的知识简要小结_weixin_41710583的博客-CSDN博客
总结:
XLNet
由于bert在pretrain和finetune之间会形成脱节(信息损失),而引入了XLnet模型,这个模型可以克服掉pretrain和finetune之间的不能有效搭