1.引言
我们知道,卷积神经网络(CNN)主要是在计算机视觉方面已经取得了很多很好的成就,但是,CNN在自然语言处理方面同样也可以拥有很好的应用。本文将介绍一个有关CNN的模型,用来对文本进行分类,并将它应用在文本分类的热门任务——情感分析上,模型的名称叫TextCNN,模型的论文地址如下:
下面将对该模型的原理进行具体介绍,并用tensorflow来实现它。
2.TextCNN模型介绍
假设对于每一个句子都进行padding,使得句子的长度都为,对于太长的句子则进行截断,则每个句子可以表示为:
其中,表示句子中的第个词汇,其词向量的维度为,表示将每个词向量进行拼接,表示词汇串的拼接,如图1中左侧所示,这样一来,每个句子都可以表示成一个的二维矩阵。
接着,对于卷积操作,TextCNN的每一个卷积核的宽度都选择与词向量的维度一样大小,而高度则可以是变动的,如卷积核,其高度为,宽度为,该卷积核的每一次卷积操作将对个词汇的词向量进行特征提取,记第步提取后的特征值为,则的计算公式如下: