ELMO具体算法过程介绍

本文深入介绍了ELMo(Embeddings from Language Models)的工作原理,从Bi-LSTM的构建到预训练和微调过程,揭示了如何利用无标注语料库生成预训练ELMo模型,并将其应用于NLP任务,提升模型性能。
摘要由CSDN通过智能技术生成

ELMo主要利用了 Bidirectional language models,公式具体如下所示:

其中表示N-token序列

具体操作如下:

1.首先使用token embeddings或者一个字符级别的CNN来计算和上下文无关的

2. 把

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值