动态卷积网络和n-gram思想用于句分类

最新推荐文章于 2024-07-05 17:29:45 发布

*Major*

最新推荐文章于 2024-07-05 17:29:45 发布

阅读量817

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41375318/article/details/103221273

版权

动态卷积网络和n-gram思想用于句分类

链接: 数据集提取码: 6cgu

基于深度学习的序列模型

《A Convolutional Neural Network For Modelling Sentences》
一种用于句子建模的卷积神经网络
作者：Nal Kalchbrenner等
单位：University of Oxford
发表会议及时间：ACL 2014

描述了一种优秀的句子分类模型

1.一论文导读
2.二论文精读
3.三代码实现
4.四问题思索

四问题思索

一论文导读

1.句子建模简介
2.相关技术

1.句子建模简介
句子建模的目标：表征句子语义内容
问题是：单个句子很少重复出现，所以要从单词入手

2.相关技术

一词表征

在传统的NLP中，我们把单词作为离散的变量，即局部表征

例子：单词可以作为独热向量

向量的维度等于单词的在字典中的数量

但是这种独热表征是正交，无关的

二基于分布式相似性的表征

词嵌入：一个单词的意思通过其周围频繁出现的单词所决定
如何使用相邻的单词去表达所要表达单词的含义呢？
使用共现矩阵，共现矩阵满足一下三种特征

包含单词意和词性信息
窗口大小为1
对称

基于窗口的共现矩阵：

在这里插入图片描述
简单共现向量的问题

单词量增加后，矩阵的尺寸增加较大
需要大量的存储空间
矩阵很稀疏
模型不强壮

解决方案：使用低维向量
低维度的密集向量
大小通常为25-1000维
方法一：在共现矩阵X上降维
基于奇异值分解
在这里插入图片描述
效果：
句法模式：相同意思的邻近

语义模式：左下方偏于动词右上方偏于名词

在这里插入图片描述

该方法存在问题如下：主要是算法复杂度高，计算困难，对新单词不敏感，模型不够强壮
在这里插入图片描述

解决方案：直接用一个单词去预测它周围的单词，直接学习和使用低维向量

在这里插入图片描述

方法2：直接学习低维向量（word2vec）

直接用单词去预测周围的向量
在这里插入图片描述

算法：

优点：很好的去编码词与词之间的相似性

在这里插入图片描述
到了word2wec词的表征已经有了较好的表现

接下来就是对句子的建模

从词向量到句子建模

二论文精读

1.论文整体框架
2.经典算法模型
3.模型
4.实验和结果
5.讨论和总结

1.论文整体框架

Abstract
Introduction
Background
Model:Convolutional Neural Networks with Dynamic k-Max Pooling
Analysis:Properties of the Sentence Model
Experiments
Conclusion

2.经典算法模型

词袋模型
连续词袋模型
深度的连续词袋模型
有一定的特征融合，可以考虑到不同词之间的组合，比如not 和 hate
n-grams词袋模型
缺点：参数量会爆炸增长
1维卷积/时间延迟网络
循环神经网络
递归神经张量网络

3.模型

在这里插入图片描述

4.实验和结果

5.讨论和总结

三代码实现

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
动态卷积网络和n-gram思想用于句分类

动态卷积网络和n-gram思想用于句分类
复制链接

扫一扫

*Major* CSDN认证博客专家 CSDN认证企业博客

码龄7年

2771: 原创

5412: 周排名

210: 总排名

299万+: 访问

: 等级

4万+: 积分

2050: 粉丝

2697: 获赞

590: 评论

9995: 收藏

私信

关注

热门文章

分类专栏

笔记

最新评论

获取python日志模块logging打印的所有信息
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
C#调用Halcon引擎
sz340403: 看了半天不知道你要说啥能不能简化点界面就这么点东西说了一堆
AILabel.js之实例2：绘制图像
撒大声地222: 你好有可以打开的文档吗
pip使用国内镜像源（附加全局修改）
李大根♂: 如何取消全局默认
C#实现WebSocket(基于Fleck-服务端和WebSocketSharp-客户端)
溫冬＇＇123: 你好，求教有偿

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。