DL-Paper精读:MobileBERT

MobileNERT: a Compact Task-Agnostic BERT for Resource-Limited Devices

https://arxiv.org/abs/2004.02984

Background

BERT在NLP领域的地位是举足轻重的,其预训练模型,在多种下游任务的迁移工作中都能给出非常好的效果。但于此同时,BERT也受困于其庞大的模型参数和较慢的运行速度,尤其是在于一些资源受限的移动端部署任务中,BERT的实际应用是非常受限的。

Related work and the limit

目前,针对BERT的压缩研究工作已有很多。比如distill BERT等工作,通过知识蒸馏,来获得一个高精度的小模型。但是这些工作一般都是基于具体下游任务场景的(“task-specifically”),这些工作的一般流程是首先将预训练的BERT模型在具体任务中进行fine-tune,然后再进行蒸馏来获得小模型。该过程是比较耗时且繁琐的,不如直接来fine-tune一个任务无关(“task-agnostic”)的小的预训练模型。但是如果直接预训练一个较窄或较浅的BERT,又会造成较严重的精度损失,无法达到原始BERT的精度。

Novel points

在预训练的阶段来进行知识蒸馏,获得一个压缩版的小BERT(m

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
06-01 15:46:59.758 4646 4646 F DEBUG : Revision: '0' 06-01 15:46:59.758 4646 4646 F DEBUG : ABI: 'arm' 06-01 15:46:59.758 4646 4646 F DEBUG : pid: 4642, tid: 4642, name: mytest >>> ./mytest <<< 06-01 15:46:59.758 4646 4646 F DEBUG : signal 11 (SIGSEGV), code 1 (SEGV_MAPERR), fault addr 0x0 06-01 15:46:59.758 4646 4646 F DEBUG : Cause: null pointer dereference 06-01 15:46:59.758 4646 4646 F DEBUG : r0 92fb5000 r1 9de3d7dc r2 9de3d7d8 r3 9de3d7e8 06-01 15:46:59.759 4646 4646 F DEBUG : r4 05080bd1 r5 9450680c r6 00000002 r7 00000000 06-01 15:46:59.759 4646 4646 F DEBUG : r8 00000000 r9 00000000 r10 00000000 r11 92fb5000 06-01 15:46:59.759 4646 4646 F DEBUG : ip ffffffda sp 9de3d718 lr 944d89b1 pc 00000000 06-01 15:46:59.775 4646 4646 F DEBUG : 06-01 15:46:59.775 4646 4646 F DEBUG : backtrace: 06-01 15:46:59.775 4646 4646 F DEBUG : #00 pc 00000000 <unknown> 06-01 15:46:59.775 4646 4646 F DEBUG : #01 pc 000e09af /system/lib/libavformat.so (avformat_find_stream_info+158) 06-01 15:46:59.775 4646 4646 F DEBUG : #02 pc 00000c0d /data/mytest (main+60) 06-01 15:46:59.775 4646 4646 F DEBUG : #03 pc 0008be09 /system/lib/libc.so (__libc_init+48) 06-01 15:46:59.775 4646 4646 F DEBUG : #04 pc 00000b8f /data/mytest (_start_main+46) 06-01 15:46:59.776 4646 4646 F DEBUG : #05 pc 00019ac7 /system/bin/linker (__dl__ZNSt3__112__hash_tableINS_17__hash_value_typeIjP6soinfoEENS_22__unordered_map_hasherIjS4_NS_4hashIjEELb1EEENS_21__unordered_map_equalIjS4_NS_8equal_toIjEELb1EEENS_9allocatorIS4_EEE14__erase_uniqueIjEEjRKT_+90) 06-01 15:46:59.776 4646 4646 F DEBUG : #06 pc 00020e8d [stack:9de1d000]
最新发布
06-02

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值