昇思25天学习打卡营第11天|munger85

基于MindSpore的GPT2文本摘要

今天来看一下文本摘要模型的训练文本摘要就是你给出一段话,然后就要把这段话做一个总结,那么总结的话肯定是要比原文要短的。
从下面的网址下载数据,这个数据很大,有5万条,所以训练的时候会很久。
在这里插入图片描述
由于这个训练数据是有中文的所以我们需要有一个能看得懂中文的偷,所以我们需要有一个能看得懂中文的tokernizer。那么这个东西呢会把中文变成一些数字。在这里插入图片描述写一个类这个类啊要继承与于这个类才能够做到这个事情,这个类要继承于这个类才能够做到这个事情。这个类就是我们的模型啊。在这里插入图片描述训练数剧大概就长这个样子。在这里插入图片描述这个是用它的工具类载入以后。可以看到它的格式是这个样子。在这里插入图片描述
由于tokenize是成对的,所以前面的是文章,后面的一个是总结
在这里插入图片描述
那么数据处理的代码是这样截取
在这里插入图片描述
在这里插入图片描述主要是为了设置动态的学习率。在越学的步数越多,那么它的变化率就越少,在开始的时候可能会多一点。
在这里插入图片描述
trainer.set_amp(level=‘O1’) # 开启混合精度,课件需要相当长的时间,所以我准备把数据变少一点。比方说变到1000。

在这里插入图片描述这个就是我把数据变少了变成1000。
在这里插入图片描述

推理

训练完成以后,我们就可以用来推理了。
那么推理的时候也是一个很长的文章,这个很长的文章也要变成数字,所以也需要用到data set的预处理。再把预处理好的数据放给模型。
在这里插入图片描述
那么我们就完成了一篇很长的文章可以,可以用来总结了。请添加图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值