mfc static 文本自适应宽度_文本分类的卷积神经网络

本文深入探讨了卷积神经网络(CNN)在文本分类中的应用,包括卷积层、池化层、全连接层等关键组件。通过实例解析了1D CNN的运作方式,讨论了不同卷积核大小、零填充、步长以及不同池化策略对模型的影响。此外,文章还介绍了K-Max Pooling和Chunk-Max Pooling等更优的池化方法,以及正则化技术在CNN模型中的作用。最后,提到了1x1卷积在网络设计中的重要性,并指出CNN在NLP领域的潜力和挑战。
摘要由CSDN通过智能技术生成

具体的CNN可以参考这篇文章:卷积神经网络

这次就先简单介绍下1D的CNN,再介绍CNN再文本中的应用

首先我们有单词的词向量,如下

3d3fd21a4ffe5e3f828308f3c1c24982.png
词向量

40d621954c354e369e95979bb82d6f27.png
卷积和

然后我们用上面的卷积核在词向量上面做卷积,词向量的维度此时成为输入的channel,对上面的序列的向量做卷积以后得到(字母代表单词首字母)

071bcaa247cb9709b69ff3392bcc69e1.png

使用padding的文本一维卷积

f860b14eb8eaceecac290a35dd2353b3.png

也可以设置多个filters

1eeabadb77abb4cd7fde85ed46212760.png

也能进行max pooling

89b2c07750d7c4c54e4fff84f1ad0373.png

上面都是步长为1的,也可以设置步长为2的

1417b5c6eaba2a5d79feacd70ea59707.png

卷积完成以后的大小是,只有一个filters的时候,设W为原始单词的长度,H为filters长度,S为步长,则卷积以后的大小为:

,多个filter就是多个大小为
的向量串联

CNN在计算机视觉领域取得了很好的结果,同时它可以应用在文本分类上面。

文本分类的关键在于准确提炼文档或者句子的中心思想,而提炼中心思想的方法是抽取文档或句子的关键词作为特征,基于这些特征去训练分类器并分类。因为CNN的卷积和池化过程就是一个抽取特征的过程,当我们可以准确抽取关键词的特征时,就能准确的提炼出文档或句子的中心思想。

卷积神经网络首次应用于文本分类可以说是在2004年Yoon Kim 在 “Convolutional Neural Networks for Sentence Classification” 一文中提出(虽然第一个用的并不是他,但是在这篇文章中提出了4种Model Variations,并有详细的调参),本文也是基于对这篇文章的理解。接下来将介绍text-CNN模型

text-CNN模型

b047968a252fe7b236d711dd31471dec.png

论文使用的模型主要包括五层,第一层是embedding layer,第二层是convolutional layer,第三层是max-pooling layer,第四层是fully connected layer,最后一层是softmax layer.

下图具体展示了如何使用cn

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值