论文阅读笔记

最新推荐文章于 2025-04-04 00:15:00 发布

beyond12111

最新推荐文章于 2025-04-04 00:15:00 发布

阅读量127

点赞数

分类专栏：论文阅读文章标签：论文阅读笔记深度学习

本文链接：https://blog.csdn.net/beyond12111/article/details/130635834

版权

论文阅读专栏收录该内容

1 篇文章

订阅专栏

1、使用语言和任务适应进行多语言预训练以实现多语言文本风格转换

论文标题：Multilingual Pre-training with Language and Task Adaptation for Multilingual Text Style Transfer

作者利用预先训练的seq2seq模型mBART进行多语言文本样式转换。使用机器翻译的数据以及高质量对齐的英语句子在作者考虑的三种目标语言中产生了最先进的结果。此外，鉴于平行数据的普遍稀缺性，作者提出了一种模块化的多语言形式迁移方法，包括两种旨在适应语言和任务的训练策略。作者的方法在没有单一语言任务特定并行数据的情况下获得了具有竞争力的性能，并且可以应用于其他风格迁移任务以及其他语言。

在这里插入图片描述

数据集介绍：
GYAFC：正式和非正式句子的英语数据集。用于Language adaptation模块。
XFORMAL：非正式文本 (0) <-> 正式文本 (1)。用于Task adaptation模块。

训练过程：
（1）Language adaptation模块训练：去噪任务的语言适应训练，目的是从损害的文本重建文本。
在这里插入图片描述
适配器组成：输入xi（h）的线性归一化、输入xi的下投影Wdown（hh）、输入xi的上投影Wup（hh）。

损失函数：其中φA是适应模块A的参数，T是目标语言中的句子，g是掩蔽句子中30%的单词的噪声函数。每种语言都有自己单独的适应模块。在语言适应训练期间，适应模块的参数被更新，而其他参数保持不变。