论文阅读-Convolutional Neural Networks for Sentence Classification(TextCNN)

本文介绍了YoonKim在2014EMNLP发表的TextCNN模型,该模型在文本分类任务中表现出色,结合效率与质量。模型包括输入层(静态、非静态词向量、多通道、随机初始化)、卷积层、池化层和全连接层。卷积层使用一维卷积,池化层采用最大池化,全连接层负责分类。TextCNN优点在于结构简单、训练快速,但可能丢失词汇顺序和位置信息。
摘要由CSDN通过智能技术生成

目录

模型原理

1.1 输入层

1.2 卷积层

1.3 池化层

1.4 全连接层

模型特点


YoonKim在2014EMNLP发的论文

TextCNN模型作为文本分类模型,通过验证实验以及业界的共识,在文本分类任务中,CNN模型已经能够取到比较好的结果,虽然在某些数据集上效果可能会比RNN稍差一点,但是CNN模型训练的效率更高。

所以,一般认为CNN模型在文本分类任务中是兼具效率与质量的理想模型。

模型原理

与传统图像的CNN网络相比,TextCNN的输入层为Embedding词向量,卷积使用一维卷积。

整个模型由四部分构成:输入层、卷积层、池化层、全连接层。

1.1 输入层

输入是一个固定长度L的文本序列。L可以前期通过语料分析得到。如果输入的文本比L长则截断,短的话则需要补充。然后将之进行向量化。作者在这里给了几种方式:

(1)static(静态词向量)
直接使用预训练模型(word2vec、fastText或者Glove)得到词向量,并且在TextCNN模型训练过程中不再调整词向量。
(2)non-static(非静态词向量)
预训练的词向量作为初始化, 训练过程中再对词向量进行微调。
(3)multiple channel&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值