文本摘要
左手指月
这个作者很懒,什么都没留下…
展开
-
Fine-tune BERT for Extractive Summarization中文数据集LCSTS复现
目前有关于Fine-tune BERT for Extractive Summarization代码只有英文数据集,未曾包含中文LCSTS的数据集,疫情在家期间尝试将代码转换到中文数据集中。**一、数据转换篇**根据源代码中对数据格式的要求,一个story文件中包含原文和摘要,以@highlight进行区分。所以我们首先需要将原LCSTS数据集进行转换,原数据集的格式如下:经过转换后的数...原创 2020-03-15 10:30:51 · 2194 阅读 · 10 评论 -
Fine-tune BERT for Extractive Summarization代码复现训练篇
前面我们尝试了数据处理部分的代码复现,一般来说此时代码所需要的基础的环境已经配置完成,并且绝大多数文件也都已经下载完成。不过在复现训练代码的时候依旧出现了一些问题。采坑记录,希望帮到后来人!**一、bert-base-uncased下载**因为我们使用的pytorch版本的bert预训练模型,因此需要下载预训练文件,当我们运行代码的时候就会自动下载。当时通常需要科学上网,一般用国内的网...原创 2020-03-12 10:48:56 · 1631 阅读 · 7 评论