Datawhale九月组队学习:情感分析
往期指路:
Task03情感分析Faster
Task04情感分析CNN
前言
本文是一个多分类的任务,前面的任务都是二分类任务,这里将对具有 6 个类的数据集执行分类。请注意,该数据集实际上并不是情感分析数据集,而是问题数据集,任务是对问题所属的类别进行分类。但是,本次学习中涵盖的所有内容都适用于任何包含属于 C C C 类之一的输入序列的示例的数据集。
笔记要点
一、 模型搭建流程
1、数据预处理
2、构建模型
3、训练模型
4、模型验证
二、 数据预处理要点记录
这里需要注意的是:
第一,我们不需要在 LABEL 字段中设置 dtype。在处理多类问题时,PyTorch 期望标签被数字化为LongTensor。
第二,这次我们使用的是TREC数据集而不是IMDB数据集。 fine_grained 参数允许我们使用细粒度标签(其中有50个类)或不使用(在这种情况下它们将是6个类)。
三、 模型搭建要点记录
我们将使用Task04中的CNN模型,但是教程中涵盖的任何模型都适用于该数据集。 唯一的区别是现在 output_dim 是 C C C维而不是 2 2 2维。
这里有了一个新的知识点:nn.ModuleList()函数,这里有一个简单的介绍:
将子模块保存在列表中。ModuleList 可以像常规 Python 列表一样索引,但它包含的模块已正确注册,并且所有 Module 方法都可以看到。原文链接
这里给大家推荐一个博主的文章,是关于 PyTorch 中的 ModuleList 和 Sequential: 区别和使用场景
总结
以上就是本文的所有内容了,继续加油呀~