本次我们学习的内容是基于MindSpore的GPT2文本摘要
文本摘要是一项重要的自然语言处理任务,可以在多个领域发挥着重要的作用,而基于MindSpore的GPT2就可以充分发挥概括原始文本的主要内容和要点的能力。
在开始之前,要进行数据的加载与处理,本次实验使用的是nlpcc2017摘要数据,内容为新闻正文及其摘要,总计50000个样本。
准备好数据之后就要开始进行数据预处理
在此之后就要开始模型的构建,即进行模型基本搭建
接下来进入模型训练
要特别注意:建议使用较高规格的算力,训练时间较长
经过训练后就可以进行模型推理
即数据处理,将向量数据变为中文数据
最后附上打卡时间