textCNN最简易的理解

在这里插入图片描述

  • 一个36个词的文本
  • embedding之后36*128
  • 卷积层,3种卷积核(长度分别为2,3,4),宽度为词的embedding长度128,每种卷积核为2个
  • 以一个长度为4的卷积核为例,卷积之后,36 * 128 与 4 * 128 卷积,得到34个 4 * 128的向量,4*128的图内部计算得到一个值,卷积得到 34 * 1 的向量
  • 以一个长度为4的卷积核为例,将34 * 1的向量进行max pooling得到1* 1的向量
  • 最后有几个卷积核,就是几维向量
  • 最后进行一个分类

对于所有的cnn来说,池化层,池化的永远是卷积层的结果,而不是通道的结果。有几个卷积核,就一定是几个通道。通道的缩小,通过下一层的卷积核来合并。

参考自:https://www.cnblogs.com/bymo/p/9675654.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TextCNN(Convolutional Neural Network)是一种用于文本分类的深度学习模型。它的工作原理是通过卷积神经网络结构对文本进行特征提取并进行分类。 TextCNN首先将每个邮件的文本内容转化为一个独热编码的向量表示。然后,利用多个不同大小的卷积核对这些向量进行卷积操作,获取不同尺寸的特征。卷积操作相当于通过滑动窗口在文本上提取局部特征。每个卷积核的参数作为过滤器来检测不同的特征。接下来,采用最大池化操作,从每个卷积层产生的特征映射中提取最重要的特征。最后,将不同尺寸和池化后的特征进行拼接,传入全连接层进行分类。 在进行训练时,TextCNN使用交叉熵损失函数来衡量预测结果与实际结果之间的差异,并通过反向传播算法来更新神经网络中的参数。 对于邮件分类任务,我们可以将每个邮件的文本内容作为输入,使用TextCNN模型进行分类。我们需要首先将训练数据进行预处理,包括词向量化、文本清洗和标签编码等。然后,根据训练数据构建TextCNN模型,并进行模型训练。在训练过程中,可以使用一部分数据作为验证集来评估模型的性能,并及时调整模型参数。最后,使用经过训练的模型对新的邮件进行分类预测。 TextCNN邮件分类具有以下优点:模型结构简单,易于理解和实现;可以通过使用预训练的词向量来提升模型性能;卷积操作可以捕获文本中的局部特征,有助于提取文本中的关键信息。然而,TextCNN也存在一些限制,例如对于长文本的处理效果可能不如RNN模型等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值