深度学习神经网络学习笔记-自然语言处理方向-论文研读-情感分析/文本分类-textcnn

概念引入

逻辑回归
线性回归
时间序列分析
神经网络
self-attention与softmax的推导
word2evc
glove

摘要大意

  1. 在使用简单的CNN模型在预训练词向量的基础上进行微调就可以在文本分类任务上就能得到很好的结果。
  2. 通过对词向量进行微调而获得的任务指向的词向量就能得到更好的结果。
  3. 同时也提出了一种即使用静态预训练词向量又使用任务指向词向量的文本分类模型。
  4. 最终在7个文本分类任务中的四个上都取得了最好的分类准确率。

TextCNN模型的结构

把每个词都映射成一个词向量,然后做一维卷积
在这里插入图片描述

在这里插入图片描述

正则化手段

Dropout
在神经网络的传播过程中,让某个神经元以一定比例停止工作,在训练另一组数据时又将停止工作的部分启用,按比例选取其他部分停止,从而增加模型的泛化能力。
L2-正则

在这里插入图片描述
在这里插入图片描述

该模型的超参数

  • Embedding方式(静/动态,glove/word2evc)
    在这里插入图片描述
    在这里插入图片描述

  • 卷积核大小

在这里插入图片描述
在这里插入图片描述

  • 卷积核个数

在这里插入图片描述

  • 多种卷积核的混用
    在这里插入图片描述

  • 激活函数 (sigmoid/relu/tanh)
    在这里插入图片描述

  • Dropout

在这里插入图片描述

在这里插入图片描述

  • L2正则化
    在这里插入图片描述

研究成果

在7个文本分类任务中的四个上取得了最好的分类效果。
在这里插入图片描述

• CNN-rand: 使用随机初始化的词向量
• CNN-static: 使用静态预训练的词向量
• CNN-non-static: 使用微调的预训练的词向量
• CNN-multichannel: 同时使用静态预训练的词向量和微调的预训练的词向量

对于预训练词向量的微调能够改变词对之间的相似度关系
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

丰。。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值