1原理图
本文重点:
文本的输入的channel通常是不同方式的embedding方式(比如 word2vec或Glove),实践中也有利用静态词向量和fine-tunning词向量作为不同channel的做法
文章使用了6个卷积核对原词向量矩阵进行卷积,(后续利用CNN处理文本都是延续了这一方式,以这一种卷积方式进行各种变化操作),TextCNN卷积用的是一维卷积。一维卷积带来的问题是需要设计通过不同 filter_size 的 filter 获取不同宽度的视野
池化,对相同卷积核产生的特征图进行连接(主要的工作在于将feature map对齐)
再进行softmax输出类别。
核心点在于可以捕捉局部相关性,具体到文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息。