这篇文章是NAACL2018年的best paper, 也是炙手可热,网上关于这篇文章的解读也是多如牛毛,但是不是有种说法,一千个人眼里有一千个哈姆雷特,所以讲自己的心得总结于此。也将比较好的解读放在下面的参考文献里。
结合发表在ACL 2017年的《Semi-supervised sequence tagging with bidirectional language models 》, 再看ELMo也许更容易理解。下图是很好地诠释了ELMo,左侧是多层的Bilstm, 右侧是bi-LM(biLM)
参考文献:
https://cstsunfu.github.io/2018/06/ELMo/
https://zhuanlan.zhihu.com/p/38254332
https://www.jianshu.com/p/a6bc14323d77
https://www.jianshu.com/p/20961a714326