task02：Updated情感分析

最新推荐文章于 2024-09-05 15:28:00 发布

GeekmanX

最新推荐文章于 2024-09-05 15:28:00 发布

阅读量95

点赞数

分类专栏：自然语言处理之情感分析文章标签：自然语言处理深度学习

本文链接：https://blog.csdn.net/maozixiang/article/details/120374761

版权

5 篇文章 3 订阅

订阅专栏

一、可优化的方面：

二、准备数据：

注意：
- RNN只能处理序列中的非padded元素（即非0数据），对于任何padded元素输出都是0，include_length设为True，以获得句子的实际长度
- 数据集使用的是IMDB影评数据集

三、词向量：

GloVe(Global Vectors for Word Representation)
使用“glove.6B.100d”，6B表示词向量是在60亿规模的tokens上获得，100d:表示词向量是100维的
TEXT.build_vocab表示从预训练的词向量中，将当前训练数据中的词汇的词向量抽取出来，构成当前训练集的 Vocab(词汇表)。对于当前词向量语料库中没有出现的单词（记为UNK，unknown），通过高斯分布随机初始化（unk_init = torch.Tensor.normal_）。

四、模型构建：

五、实例化模型+传入参数：

六、训练模型：

将’SGD’更改为’Adam’，我们只需将’optim.SGD’更改为’optim.Adam’，还要注意，我们不提供 Adam初始学习率，因为PyTorch提供了默认的初始学习率。

七、验证模型：

负面评论返回接近0的值，正面评论返回接近1的值。

关注