PaddlePaddle深度学习实践：使用卷积神经网络进行情感分析

史舒畅Cunning

于 2025-06-11 09:17:34 发布

阅读量280

点赞数 4

本文链接：https://blog.csdn.net/gitblog_00729/article/details/148578521

版权

PaddlePaddle深度学习实践：使用卷积神经网络进行情感分析

awesome-DeepLearning 深度学习入门课、资深课、特色课、学术案例、产业实践案例、深度学习知识百科及面试题库The course, case and knowledge of Deep Learning and AI 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-DeepLearning

引言

在自然语言处理(NLP)领域，情感分析是一项基础而重要的任务。传统方法通常使用循环神经网络(RNN)来处理这类序列数据，但近年来，卷积神经网络(CNN)在文本处理中也展现出了强大的能力。本文将介绍如何使用PaddlePaddle框架构建一个基于CNN的文本分类模型——textCNN，用于情感分析任务。

一维卷积在文本处理中的应用

基本概念

虽然CNN最初是为图像处理设计的，但我们可以将文本序列视为"一维图像"，其中每个词元对应一个像素点。这种视角使得CNN能够捕捉文本中的局部特征，如n-gram模式。

一维卷积运算原理

一维卷积通过在输入序列上滑动卷积核窗口进行计算。对于每个位置，卷积核与对应的输入子序列进行元素级相乘后求和，得到输出序列的一个值。这个过程可以高效地提取文本中的局部特征。

def corr1d(X, K):
    w = K.shape[0]
    Y = paddle.zeros([X.shape[0] - w + 1],dtype=X.dtype)
    for i in range(Y.shape[0]):
        Y[i] = (X[i: i + w] * K).sum()
    return Y

多通道一维卷积

当输入具有多个通道（如词向量的不同维度）时，我们需要为每个通道分别计算卷积，然后将结果相加：

def corr1d_multi_in(X, K):
    return sum(corr1d(x, k) for x, k in zip(X, K))

textCNN模型架构

模型组成

textCNN模型主要由以下几个组件构成：

词嵌入层：将词索引转换为密集向量表示
卷积层：使用不同大小的卷积核捕捉不同长度的n-gram特征
最大时间汇聚层：提取每个特征通道的最显著特征
全连接层：将特征映射到输出类别

模型实现

以下是使用PaddlePaddle实现textCNN的核心代码：

class TextCNN(nn.Layer):
    def __init__(self, vocab_size, embed_size, kernel_sizes, num_channels):
        super(TextCNN, self).__init__()
        self.embedding = nn.Embedding(vocab_size, embed_size)
        self.constant_embedding = nn.Embedding(vocab_size, embed_size)
        self.dropout = nn.Dropout(0.5)
        self.decoder = nn.Linear(sum(num_channels), 2)
        self.pool = nn.AdaptiveAvgPool1D(1)
        self.relu = nn.ReLU()
        self.convs = nn.LayerList()
        for c, k in zip(num_channels, kernel_sizes):
            self.convs.append(nn.Conv1D(2 * embed_size, c, k))

模型训练与评估

数据准备

我们使用IMDb电影评论数据集进行情感分析实验。该数据集包含25000条训练数据和25000条测试数据，每条数据被标记为正面或负面评价。

训练过程

初始化模型参数
加载预训练词向量（如GloVe）
定义优化器和损失函数
进行多轮训练

# 初始化模型
embed_size, kernel_sizes = 100, [3, 4, 5]
net = TextCNN(len(vocab), embed_size, kernel_sizes, [100, 100, 100])

# 加载预训练词向量
glove_embedding = d2l.TokenEmbedding('glove.6b.100d')
embeds = glove_embedding[vocab.idx_to_token]
net.embedding.weight.set_value(embeds)

# 训练配置
lr, num_epochs = 0.001, 5
trainer = paddle.optimizer.Adam(learning_rate=lr, parameters=net.parameters())
loss = nn.CrossEntropyLoss(reduction="none")

# 开始训练
d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices)

模型评估

训练完成后，我们可以在测试集上评估模型性能，并用于实际情感预测：

# 测试准确率
d2l.predict_sentiment(net, vocab, 'this movie is so great')  # 输出: 'positive'
d2l.predict_sentiment(net, vocab, 'this movie is so bad')   # 输出: 'negative'