参考:
https://blog.csdn.net/m0_38088359/article/details/83904566
(略读即可)网上没有找到很好的教程
个人理解:
elmo是先用语料库训练一个语言模型(双向lstm),在实际应用中,当需要对词进行求编码的时候,就将词的句子输入模型当中,然后将该词的所有中间激活值取出来作为该词的编码。由于这种方式中,为了获得一个词的编码是需要输入该词所在的句子的,因此同一个词挡在不同句子中时,求出的编码也可能不同。即实现了编码中包含语境信息的功能。