Datawhale九月组队学习--情感分析--Task05

Datawhale九月组队学习:情感分析

往期指路:

   Task01情感分析BaseLine

   Task02情感分析Upgrade

   Task03情感分析Faster
   Task04情感分析CNN


前言

  本文是一个多分类的任务,前面的任务都是二分类任务,这里将对具有 6 个类的数据集执行分类。请注意,该数据集实际上并不是情感分析数据集,而是问题数据集,任务是对问题所属的类别进行分类。但是,本次学习中涵盖的所有内容都适用于任何包含属于 C C C 类之一的输入序列的示例的数据集。


笔记要点

一、 模型搭建流程

  1、数据预处理
  2、构建模型
  3、训练模型
  4、模型验证

二、 数据预处理要点记录

这里需要注意的是:

   第一,我们不需要在 LABEL 字段中设置 dtype。在处理多类问题时,PyTorch 期望标签被数字化为LongTensor。
   第二,这次我们使用的是TREC数据集而不是IMDB数据集。 fine_grained 参数允许我们使用细粒度标签(其中有50个类)或不使用(在这种情况下它们将是6个类)。

注意:TorchText中TREC的相关用法点这里

三、 模型搭建要点记录

  我们将使用Task04中的CNN模型,但是教程中涵盖的任何模型都适用于该数据集。 唯一的区别是现在 output_dim 是 C C C维而不是 2 2 2维。

  这里有了一个新的知识点:nn.ModuleList()函数,这里有一个简单的介绍:
将子模块保存在列表中。ModuleList 可以像常规 Python 列表一样索引,但它包含的模块已正确注册,并且所有 Module 方法都可以看到。原文链接

  这里给大家推荐一个博主的文章,是关于 PyTorch 中的 ModuleList 和 Sequential: 区别和使用场景


总结

  以上就是本文的所有内容了,继续加油呀~

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦想拯救世界_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值