论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

开放知识图谱

于 2021-11-11 21:53:27 发布

阅读量1.8k

点赞数

文章标签：算法人工智能机器学习编程语言 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/121279257

版权

论文研究了m-BERT作为多语言知识库的效果，将其应用于53种语言的LAMA数据集，发现m-BERT在某些语言上表现接近单语模型，但存在语言偏置，且通过跨语言池化预测能提升性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

笔记整理：谭亦鸣，东南大学博士生

来源：EACL‘21

链接：https://aclanthology.org/2021.eacl-main.284.pdf

概述

本文关注将语言模型（LM）视作一个知识库，然后用于解决例如句子填空这样的NLP任务，这个做法在单语言（英语）取得了不错的效果。因此在这篇论文里，作者着重关注了以m-BERT为代表的多语言语言模型是否也能作为多语言KG适用于多语言NLP场景。他将单语LAMA数据集翻译为53种语言，并使用m-BERT作为知识库进行了实验评估，着重关注了m-BERT的可用性，和在不同语言上的性能差异性。从实验效果来看，首先m-BERT在部分语言上能够实现和单语LAMA实验类似的效果，另一方面，m-BERT虽然基于104weikipedia训练得到，但是依然存在语言偏置

背景与动机

单语上，使用预训练模型作为知识库（不做微调的情况下）来完成一些自然语言处理任务例如简单的文本生成，模板填空等，已经被证明是

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。