动态卷积网络和n-gram思想用于句分类

动态卷积网络和n-gram思想用于句分类

链接: 数据集 提取码: 6cgu

基于深度学习的序列模型

《A Convolutional Neural Network For Modelling Sentences》
一种用于句子建模的卷积神经网络
作者:Nal Kalchbrenner等
单位:University of Oxford
发表会议及时间:ACL 2014

描述了一种优秀的句子分类模型

四 问题思索

一 论文导读

1.句子建模简介
2.相关技术

1.句子建模简介
句子建模的目标:表征句子语义内容
问题是:单个句子很少重复出现,所以要从单词入手

2.相关技术

一 词表征

在传统的NLP中,我们把单词作为离散的变量,即局部表征

例子:单词可以作为独热向量

向量的维度等于单词的在字典中的数量

但是这种独热表征是正交,无关的

二 基于分布式相似性的表征

词嵌入:一个单词的意思通过其周围频繁出现的单词所决定
如何使用相邻的单词去表达所要表达单词的含义呢?
使用共现矩阵,共现矩阵满足一下三种特征

  1. 包含单词意和词性信息
  2. 窗口大小为1
  3. 对称
    在这里插入图片描述
    基于窗口的共现矩阵:

在这里插入图片描述
简单共现向量的问题

  1. 单词量增加后,矩阵的尺寸增加较大
  2. 需要大量的存储空间
  3. 矩阵很稀疏
  4. 模型不强壮

解决方案:使用低维向量
低维度的密集向量
大小通常为25-1000维
方法一:在共现矩阵X上降维
基于奇异值分解
在这里插入图片描述
效果:
句法模式:相同意思的邻近
在这里插入图片描述
语义模式:左下方偏于动词 右上方偏于名词

在这里插入图片描述

该方法存在问题如下:主要是算法复杂度高,计算困难,对新单词不敏感,模型不够强壮
在这里插入图片描述

解决方案:直接用一个单词去预测它周围的单词,直接学习和使用低维向量

在这里插入图片描述

方法2:直接学习低维向量(word2vec)

直接用单词去预测周围的向量
在这里插入图片描述
在这里插入图片描述
算法:
在这里插入图片描述
优点:很好的去编码词与词之间的相似性

在这里插入图片描述
到了word2wec词的表征已经有了较好的表现

接下来就是对句子的建模

从词向量到句子建模

二 论文精读

1.论文整体框架
2.经典算法模型
3.模型
4.实验和结果
5.讨论和总结

1.论文整体框架

  • Abstract
  • Introduction
  • Background
  • Model:Convolutional Neural Networks with Dynamic k-Max Pooling
  • Analysis:Properties of the Sentence Model
  • Experiments
  • Conclusion

2.经典算法模型

  • 词袋模型
    在这里插入图片描述

  • 连续词袋模型
    在这里插入图片描述

  • 深度的连续词袋模型
    有一定的特征融合,可以考虑到不同词之间的组合,比如not 和 hate
    在这里插入图片描述

  • n-grams词袋模型
    缺点:参数量会爆炸增长
    在这里插入图片描述

  • 1维卷积/时间延迟网络

  • 循环神经网络
    在这里插入图片描述

  • 递归神经张量网络
    在这里插入图片描述
    在这里插入图片描述

3.模型

在这里插入图片描述

4.实验和结果

5.讨论和总结

三 代码实现

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值