上文提到GPT2的文本生成任务,确实比较智障,一到200多个字之后就只会阿巴阿巴阿巴
本文我们我们讨论一下比较冷门的文本复述任务,其实和语义相似度任务比较像,只不过一个是分类 一个是生成 但是对于基础的编码解码来说区别不大。
一、下载项目代码和准备数据
项目地址: https://github.com/Jeremiah0425/text_scalpel
预训练权重:百度网盘 链接: https://pan.baidu.com/s/1yho8ihR9C6rBbY-IJjSagA 提取码: 2a97
LCQMC数据 下载地址 : 百度网盘 链接: https://pan.baidu.com/s/1T0-jUEz2gmu99j1aM7lyTg 提取码:ynt0
数据需要手动改一下,把tsv改成txt就行 文件名就直接改成train.txt dev.txt test.txt
二、准备环境
conda 虚拟环境搭建起来,基本从项目的requirements.txt的里面安装就行
防止tensorflow-gpu有问题先用conda install tensorflow-gpu=1.15.0装