Distill-BERT-Textgen 开源项目教程

嵇千知

于 2024-08-30 09:53:11 发布

阅读量256

点赞数 4

本文链接：https://blog.csdn.net/gitblog_00794/article/details/141709368

版权

Distill-BERT-Textgen 开源项目教程

Distill-BERT-TextgenResearch code for ACL 2020 paper: "Distilling Knowledge Learned in BERT for Text Generation".项目地址:https://gitcode.com/gh_mirrors/di/Distill-BERT-Textgen

项目介绍

Distill-BERT-Textgen 是一个用于文本生成的开源项目，基于 ACL 2020 论文 "Distilling Knowledge Learned in BERT for Text Generation" 开发。该项目通过知识蒸馏技术，将 BERT 模型中学到的知识应用于文本生成任务，从而提高生成文本的质量和效率。

项目快速启动

环境准备

克隆项目仓库：

git clone https://github.com/ChenRocks/Distill-BERT-Textgen.git
cd Distill-BERT-Textgen

安装依赖：
```
pip install -r requirements.txt
```

数据准备

假设你已经有一个预处理好的数据集，存储在 <data_folder> 目录下。

启动 Docker 容器

source launch_container.sh <data_folder> <output_folder>

运行训练脚本

在 Docker 容器内运行以下命令：

python run_cmlm_finetuning.py \
    --train_file /data/de-en/DEEN.db \
    --vocab_file /data/de-en/DEEN.vocab.pt \
    --valid_src /data/de-en/dev.de.bert \
    --valid_tgt /data/de-en/dev.en.bert \
    --bert_model bert-base-multilingual-cased \
    --output_dir /output/<exp_name> \
    --train_batch_size 16384 \
    --learning_rate 5e-5 \
    --valid_steps 5000 \
    --num_train_steps 100000