昇思25天学习打卡营第10天|munger85

基于 MindSpore 实现 BERT 对话情绪识别

今天我们来学习如何用这个框架来训练一个情绪识别的模型。
自定义的数据载入
首先我们肯定要定义上面的数据处理的代码当我们指定一个路径的时候,这个路径就是我们的训练数据,它会把这个训练数据载入进来到不同的函数里面。进行未来的训练。去年数据就长得像下面这个样子。0就表示消极,一是表示中性,二是表示积极的
在这里插入图片描述
这个数据是来自于百度所以直接从互联网上面下载下来解压缩就会有个目录目录里面,所以直接从互联网上面下载下来解压缩就会有个目录,目录里面有这些训练的数据。在这里插入图片描述下面这个指出来的函数大概就是用来判断有没有显卡的。 在这里插入图片描述可见有没有显卡它在再把它变成一批的时候都是不一样的,他在把它变成一批的时候都是不一样的。有显卡的时候直接调用把一些数据换成,把一些数据换成一批数据。为什么没有显卡的时候要调用另外一个函数去把它做填充呢。这个框架完全可以把这一步两步操作融合成一个啊。我觉得这可能是一个改进的地方吧。在这里插入图片描述这一步所指出来出来填充的id就是零这个就是用于上面进行缺失数据的填充的ID就是零,这个就是用于上面进行缺失数据的填充的时候会用到的一个数字。在这里插入图片描述那么训练数据做好了,批次又做好了填充。他就会有下面的这几列。在这里插入图片描述
现在可以下载基础模型拿来去做训练呢。基础模型可以设置分类的类别是三个。在这里插入图片描述当然也可以设置自动混合精度来加快训练的速度。

model = auto_mixed_precision(model, ‘O1’)
这个模型不是很大三百多兆在这里插入图片描述会要设置几个回调的函数用来保存模型,以免训练着训练着突然就断电了,就白训练了,所以需要根据训练了多少步之后去保存一下模型那么保存一下模型的话它就会有很多模型所以需要设置,那么保存一下模型的话,它就会有很多模型,所以需要设置一些指标来衡量哪一个模型是最好的。这个指标就是准确度。在这里插入图片描述可见训练中的消耗是三个g不到的显存。在这里插入图片描述训练就会这样子进行,然后它会输出一轮,然后检测。它的检测的时候的准确度
在这里插入图片描述模型训练呢一共花了13分钟。所以还是蛮久的,可能是数据比较大吧。
在这里插入图片描述训练完了之后,我们可以拿一些在训练集以外的数据做一个验证看一下它的训练数据以外的数据的检测出来的准确度是多少?
在这里插入图片描述之后就可以完全投入生产使用了。大数据就是相当于是把所有的模型训练数据都拿过来比较一下。其中画横线的部分就是模型的推理过程,推理只需要把要推理的数据放进来到参数里面它就会得到Logits。然后再算出来概率最大的那一个分类是什么?
在这里插入图片描述我这边就测试的一些极端情况,所以我就在一句话里面再加了一个词。然后他也能够帮我判断出来这是消极的。
在这里插入图片描述那么他是中文是判断是可以的,我试一下加一个英文的看怎么样?可见还是非常好用的。
在这里插入图片描述
在这里插入图片描述

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值