Convolutional Neural Networks for Sentence Classification

研究发现,使用预训练的词向量和简单的CNN模型能有效地进行句子级分类任务,并通过微调获得更好的性能。提出的模型改进允许同时利用任务特定和静态向量,改善了4个关键任务的州-of-the-art结果,包括情感分析和问题分类。采用Adadelta优化算法,结合dropout防止过拟合,解决了变长句子的问题。
摘要由CSDN通过智能技术生成

摘要

We report on a series of experiments with
convolutional neural networks (CNN)
trained on top of pre-trained word vectors for sentence-level classification tasks.
We show that a simple CNN with little hyperparameter tuning and static vectors achieves excellent results on multiple benchmarks. Learning task-specific
vectors through fine-tuning offers further
gains in performance. We additionally
propose a simple modification to the architecture to allow for the use of both
task-specific and static vectors. The CNN
models discussed herein improve upon the
state of the art on 4 out of 7 tasks, which
include sentiment analysis and question
classification

  • 任务:句子级分类任务sentence-level classification tasks
  • a simple CNN with little hyperparameter tuniing and static vectors.

模型架构

在这里插入图片描述
x i ∈ R k x_i \in R^k xiRk the k-dimensional word vector
A sentence of length: n n n
x 1 : n = x 1 ⊗ x 2 ⊗ ⋯   , ⊗ x n x_{1:n} = x_1\otimes x_2\otimes \cdots,\otimes x_n x1:n=x1x2,xn

⊗ \otimes is the concatenation operator.

x i : i + j x_{i:i+j} xi:i+j 代表单词的拼接
w ∈ R h k w \in R^{hk} wRhk: 卷积滤波器。

卷积操作

在这里插入图片描述

a max-over-time pooling operation

c ^ = max ⁡ c \hat{c} = \max{c} c^=maxc

倒数第二层加入dropout ,防止过拟合。

解决了句子长度可变问题。

  • the penultimate layer 倒数第二层

a fully connected softmax layer

数据集

MR

SST-1:

SST-2:

Subj

TREC

CR

• MPQA

更新算法

  • 随机梯度下降法:Adadelta 算法
  • 预训练词向量:the publicly available word2vec vectors

模型变体

  • CNN-rand
  • CNN-static
  • CNN-non-static
  • CNN-multichannel
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

big_matster

您的鼓励,是给予我最大的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值