论文标题FEW-SHOT TEXT CLASSIFICATION WITH DISTRIBUTIONAL SIGNATURES
这篇文章是一片用到了元学习来处理问题的文章,文章中提到了关于预训练阶段,一些底层模式可以被共享,这在计算机视觉中比较明显,例如底层的边缘检测等,但是对于文本处理,在一类任务中起到重要作用的单词,可能在另一类任务中就不那么重要了
比如在医药领域,可能sleep是一个很重要的词,在政治领域trump是一个很重要的的词,但是当在不同领域的时候他们的重要性会下降
那么本文提出了一种解决办法
元学习框架内进行训练,将这些特征映射到注意力分数,然后用注意力分数来衡量单词的词汇表示。
第一个是注意力生成器,它可以将分布签名转换为注意力分数,从而反映出单词对分类的重要性。 第二个组件,回归器,仅需看几个训练示例,即可迅速学会做出预测。 注意生成器在所有episode之间共享,而回归器则从头开始为每个episode训练。 后者的预测损失为注意力产生者提供了监督。 从理论上讲,我们显示出注意力生成器对于单词替换扰动具有鲁棒性。
大致意思就是先通过元学习框架中学习到的特征来生成注意力向量
然后用此向量和embeding相乘
作为后续的输入
损失函数没有用原型网络
,而是用当作普通的分类网络
论文笔记3-12
最新推荐文章于 2021-04-23 17:46:45 发布