mfc static 文本自适应宽度_文本分类的卷积神经网络

最新推荐文章于 2023-08-14 19:03:50 发布

weixin_39758032

最新推荐文章于 2023-08-14 19:03:50 发布

阅读量208

点赞数

文章标签： mfc static 文本自适应宽度

本文链接：https://blog.csdn.net/weixin_39758032/article/details/111712447

版权

本文深入探讨了卷积神经网络（CNN）在文本分类中的应用，包括卷积层、池化层、全连接层等关键组件。通过实例解析了1D CNN的运作方式，讨论了不同卷积核大小、零填充、步长以及不同池化策略对模型的影响。此外，文章还介绍了K-Max Pooling和Chunk-Max Pooling等更优的池化方法，以及正则化技术在CNN模型中的作用。最后，提到了1x1卷积在网络设计中的重要性，并指出CNN在NLP领域的潜力和挑战。

摘要由CSDN通过智能技术生成

具体的CNN可以参考这篇文章：卷积神经网络

这次就先简单介绍下1D的CNN，再介绍CNN再文本中的应用

首先我们有单词的词向量，如下

词向量

卷积和

然后我们用上面的卷积核在词向量上面做卷积，词向量的维度此时成为输入的channel，对上面的序列的向量做卷积以后得到(字母代表单词首字母)

使用padding的文本一维卷积

也可以设置多个filters

也能进行max pooling

上面都是步长为1的，也可以设置步长为2的

卷积完成以后的大小是，只有一个filters的时候，设W为原始单词的长度，H为filters长度，S为步长，则卷积以后的大小为：

，多个filter就是多个大小为

的向量串联

CNN在计算机视觉领域取得了很好的结果，同时它可以应用在文本分类上面。

文本分类的关键在于准确提炼文档或者句子的中心思想，而提炼中心思想的方法是抽取文档或句子的关键词作为特征，基于这些特征去训练分类器并分类。因为CNN的卷积和池化过程就是一个抽取特征的过程，当我们可以准确抽取关键词的特征时，就能准确的提炼出文档或句子的中心思想。

卷积神经网络首次应用于文本分类可以说是在2004年Yoon Kim 在 “Convolutional Neural Networks for Sentence Classification” 一文中提出（虽然第一个用的并不是他，但是在这篇文章中提出了4种Model Variations，并有详细的调参），本文也是基于对这篇文章的理解。接下来将介绍text-CNN模型

text-CNN模型