[预训练语言模型专题] MT-DNN(KD) : 预训练、多任务、知识蒸馏的结合
本文为预训练语言模型专题系列第八篇快速传送门1-4:[萌芽时代]、[风起云涌]、[文本分类通用技巧]、[GPT家族]5-7:[BERT来临]、[浅析BERT代码]、[ERNIE合集]感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理,我们将沿此脉络前行,探索预训练语言模型的前沿技术,红框中为已介绍的文章,绿框中为本期介绍的文章,欢迎大家留言讨论交流。Multi-Task Deep Neural Networks for Natural Language U...
复制链接