《Convolutional Neural Networks for Sentence Classification》
概述:使用基于word2vec的单层CNN,对多个文本分类任务进行了评测。
结论:
1.word2vec是个好东西。使用pre-training 训练的资源成为nlp不可或缺的一部分。
2.Dropout可以提高2%-4%的相对性能。
3.多通道的CNN相对于Static CNN并没有太大提升。对Static CNN进行finetune可以进一步提升效果。
4.Adadelta算法与Adagram算法得到的效果基本相当,但是Adadelta算法需要的epoch更少。
5.使用宽度为(3,4,5)的三种不同卷积核提取特征,再进行最大池化,最后将提取到的特征拼接在一起,输入到一个fullyconnect层,再经过softmax层,获取在分类标签上的概率分布。