解读FastBERT《a Self-distilling BERT with Adaptive Inference Time》
https://arxiv.org/pdf/2004.02178.pdfThe code is publicly available at https:// github.com/autoliuweijie/FastBERT.(作者目前还未放)FastBERT的推理过程,每个样本执行的层数根据其复杂性而变化。这说明了一个样本自适应机制。以一批输入(批大小= 4)为例,Transfo...