使用Fairseq微调预训练模型

VIP文章 Chromatica_

已于 2022-04-20 11:20:56 修改

阅读量2.7k

点赞数 1

文章标签：语言模型 nlp

于 2022-04-20 11:19:23 首次发布

本文链接：https://blog.csdn.net/CheatEngine_jaz/article/details/124292947

版权

使用Fairseq微调预训练模型

1. 先决条件
2. 流程

1. 先决条件

从源码安装Fairseq
安装transformers

脚本在https://github.com/jazzisfuture/FineTuningXLM-R
平行语料 https://www.aliyundrive.com/s/nBX6YRA
pretrained模型 xlmr-base xlmr-large

2. 流程

简化流程

script/tokenize_para.py
script/split_file.sh
script/gen.sh
修改config文件内的data和pretraing模型位置
script/finetuning.sh

2.1 数据集处理

使用huggingface transformers的tokenizer进行数据处理

XLM-R TLM 训练时模型的输入形式为

为了对模型进行继续预训练我们要将平行语料处理为
<s> a</s></s>b</s>的形式
Transformers的tokenizer提供了这将两个句子处理为TLM输入的能力

tokenizer.tokenize(the_data,add_special_tokens=True)

处理语料的core code

def xlm_tok(data,fout):
    fout = open(fout, 'w', encoding='utf-8')
    tok = AutoTokenizer.from_pretrained(

最低0.47元/天解锁文章

优惠劵

Chromatica_

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
使用Fairseq微调预训练模型

使用Fairseq微调预训练模型
复制链接

扫一扫

Fairseq学习日记：注定麻烦的旅程

starinline的专栏

11-22

6671

现在开头：Fairseq是一个正在快速迭代的产品，而且是开源的！这不是表扬，这意味着三件事情： 1.他没有文档！所有框架代码都没有任何注释，包括函数docstring都没有 2.他没有经过有效测试，估计是抢时间吧！即使是官网Readme里的例子也是无法跑起来的！ 3.他是一个框架，而且是一个非常不Pythonic的框架，充斥着inline/包装器/莫名其妙的语法。虽然这三点决定他真的对不住Facebook的金字招牌，但是作为一个学习者，总要把他运行起来，那么开始这场针对 FaceBOOK派“全

Fairseq的wav2vec2的踩坑之旅4：如何手动将一个Fairseq的wav2vec2模型转换为transformers的模型

starinline的专栏

03-27

6545

摘要：本文尝试将用中文拼音预训练的Fairseq的wav2vec2模型转换为transformers模型（以下简写trms），因为汉语拼音的label数量与英文不同，所以本文需要进行模型转换函数的修改。自己预训练和finetune的模型没有稳定输出，但是应该是label转换的问题，但是对于SOTA的复现党就没有任何问题了文章目录摘要：1.分析transofrmers模型的结构2.使用transformers的工具进行导入2.1 导入工具参数说明2.2 创建对应的tokenizer需要的文件3.测试转换

2 条评论您还未登录，请先登录后发表或查看评论

fairseq-mbart微调过程

Chinenana的博客

04-18

322

大坑：fairseq官网一定不要切换到main分支clone（如果你的cuda版本够新的话可以）我的cuda：11.2，如果是10多看看自己cuda集合，可以切换到比较新的cuda版本--安装过程中会出现其他报错：搜索对应解决方案都能解决/ 比如numpy版本问题等。然后进行fairseq install。

论文阅读_音频表示_wav2vec_2.0

谢彦的技术博客

05-21

636

模型用于语音识别，模型结构结合了CNN和Transformer。文章言简意赅，结构非常舒服。

使用Fairseq进行Bart预训练

qq_52852138的博客

02-19

2164

使用Fairseq进行Bart预训练

fairseq运行命令中的config-dir和config-name参数

qq_39466623的博客

09-13

454

fairseq运行命令中的config-dir和config-name在哪里定义？不通过命令行传参也可定义。

Fairseq训练Wav2vec2代码阅读记录

qq_39466623的博客

09-13

513

阅读理解之fairseq训练wav2vec2代码

chatglm使用lora进行模型微调训练

06-24

chatglm使用lora进行模型微调训练，没有采用官方的方案，使用了另一种效果好的方案，对于显存特别友好，24g显存就能训练自己的垂直领域大模型训练了，效果还是非常的好的，适合自己机器不是很多的需要做实验的同学

PyTorch加载预训练模型实例(pretrained)

09-18

今天小编就为大家分享一篇PyTorch加载预训练模型实例(pretrained)，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

使用pytorch搭建AlexNet操作(微调预训练模型及手动搭建)

12-23

本文介绍了如何在pytorch下搭建AlexNet，使用了两种方法，一种是直接加载预训练模型，并根据自己的需要微调（将最后一层全连接层输出由1000改为10），另一种是手动搭建。构建模型类的时候需要继承自torch.nn.Module...

基于中文 GPT2 预训练模型的文本分类微调.zip

最新发布

01-07

依赖环境 Python 3.10.6 torch 1.13.0 transformers 4.27.3 deepspeed 0.8.3

复现BART finetune历程

weixin_43874380的博客

01-18

2996

复现BART finetune历程准备安装fairseq，使用fairseq官方提供的finetune代码 git clone https://github.com/pytorch/fairseq cd fairseq pip install --editable ./ 下载Xsum与DailyCNN数据集，已处理为train.source等形式。解压保存在/home/DataSets/Xsum和/home/DataSets/DailyCNN https://github.com/huggin

【机器翻译】Fairseq常用checkpoint相关训练参数

weixin_43857772的博客

09-20

840

-eval-bleu-remove-bpe sentencepiece 不适合目标端为中文。--patience x个epoch后不再出现checkpoint_best训练终止。--eval-bleu-detok moses 不适合目标端为中文。目标端为中文可以使用sacremoses生成bleu的待测文档。--finetune-from-model 迁移学习可以用。sacremoses的效果。

在Huggingface Transformers中使用DeepSpeed加速训练

CheatEngine_jaz的博客

05-07

9845

在Huggingfac🤗Transformers中使用DeepSpeed加速库

fairseq笔记

koala_cola的博客

01-13

2879

文章目录训练新模型数据预处理预处理脚本python的参数类型训练新模型以机器翻译为例子开始数据预处理 Fairseq 包含多个翻译数据集的示例预处理脚本：IWSLT 2014（德语-英语）、WMT 2014（英语-法语）和 WMT 2014（英语-德语）。预处理和二值化 IWSLT 数据集： > cd examples/translation/ #把当前路径切换到翻译示例下 > bash prepare-iwslt14.sh #运行预处理脚本 > cd ../..

Facebook生产的垃圾Fairseq——神一般的传参工具

starinline的专栏

11-22

2815

见到Fairseq的Hydra真实给跪了，这真的是Facebook的产品吗？如此复杂的框架，各种函数调用和inline，混乱的路径推定，毫无指导意义的文档！ $ fairseq-hydra-train \ distributed_training.distributed_port=$PORT \ task.data=/path/to/data \ model.w2v_path=/path/to/model.pt \ --config-path /path/to/fairs

FAIRSEQ -- fairseq-preprocess command not found

qq_45736022的博客

12-08

2012

fairseq-preprocess command not found 对于新入坑的我们来说是很常见的一条报错，那这条报错基本上是因为没有安装editable。那解决方案也是很简单，在fairseq的官方安装说明中可以找到具体的操作步骤。 cd fairseq pip install editable ./ cd .. 在安装成功后可以在fairseq目录下出现 build 和 ==fairseq.eff-info==这两个新目录，接下来就可以直接使用 fairseq-preprocess 来调用pre

使用fairseq从头开始训练一个中英神经机器翻译模型

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交