Python 深度学习 Class 6：深度学习用于文本和序列

最新推荐文章于 2024-08-21 00:37:57 发布

By4te

最新推荐文章于 2024-08-21 00:37:57 发布

阅读量937

点赞数

分类专栏： Python 深度学习文章标签：深度学习 python 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49939117/article/details/122253844

版权

Python 同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

目录

6.1 处理文本序列

1.one-hot编码

6.2 循环神经网络

1.Keras循环层

2.高级循环层

6.3 RNN高级用法

6.4 用卷积神经网络处理序列

4.CNN与RNN结合处理长序列

用于处理序列的两种基本的深度学习算法分别是循环神经网络（recurrent neural network）和一维卷积神经网络

6.1 处理文本序列

文本向量化（vectorize）是指将文本转换为数值张量的过程。

（1）将文本分割为单词，并将每个单词转换为一个向量

（2）将文本分割为字符，并将每个字符转换为一个向量。

（3）提取单词或字符的 n-gram，并将每个 n-gram 转换为一个向量。n-gram 是多个连续单词或字符的集合（n-gram 之间可重叠）。

1.one-hot编码

可以使用单词级和字符级的编码

2.词嵌入

（1）Embedding层学习词嵌入

（2）使用预训练的词嵌入

从预计算的嵌入空间中加载嵌入向量

3.结论

（1）将原始文本转换为神经网络能够处理的格式。
（2）使用 Keras 模型的 Embedding层来学习针对特定任务的标记嵌入。
（3）使用预训练词嵌入在小型自然语言处理问题上获得额外的性能提升。

6.2 循环神经网络

CNN网络没有记忆，即前馈网络。循环神经网络：遍历所有序列元素，并保存一个状态（state），其中包含与已查看内容相关的信息

1.Keras循环层

from keras.layers import SimpleRNN

处理序列批量

2.高级循环层

由于存在梯度消失问题，simpleRNN并不实用.

LSTM：它保存信息以便后面使用，从而防止较早期的信号在处理过程中逐渐消失。

6.3 RNN高级用法

见资料

6.4 用卷积神经网络处理序列

1.一维卷积

2.一维池化

从输入中提取一维序列段（即子序列），然后输出其最大值（最大池化）或平均值（平均池化）。

3.实现

见资料

4.CNN与RNN结合处理长序列

要想结合卷积神经网络的速度和轻量与RNN 的顺序敏感性，一种方法是在RNN 前面使用一维卷积神经网络作为预处理步骤

5.结论

（1）二维卷积神经网络在二维空间中处理视觉模式时表现很好，与此相同，一维卷积神经网络在处理时间模式时表现也很好。
（2）通常情况下，一维卷积神经网络的架构与计算机视觉领域的二维卷积神经网络很相似，它将Conv1D 层和MaxPooling1D 层堆叠在一起，最后是一个全局池化运算或展平操作。
（3）因为 RNN 在处理非常长的序列时计算代价很大，但一维卷积神经网络的计算代价很小，所以在RNN 之前使用一维卷积神经网络作为预处理步骤是一个好主意，这样可以使序列变短，并提取出有用的表示交给RNN 来处理

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

By4te CSDN认证博客专家 CSDN认证企业博客

码龄4年

93: 原创

30万+: 周排名

219万+: 总排名

5万+: 访问

: 等级

974: 积分

368: 粉丝

27: 获赞

6: 评论

181: 收藏

私信

关注

热门文章

分类专栏

机器学习 36篇
C++ 30篇
Linux 5篇
数据结构 8篇
计算机网络 6篇
操作系统 5篇
元分析 1篇
Sleep stage 1篇
深度学习 10篇
Python 42篇

最新评论

脑电分析工具MNE教程
宸静: 使用scikit-learn进行多分类时，这里报错，TypeError: psd_welch() got an unexpected keyword argument 'picks' 这个怎么解决呢
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
青青子佩983: 明白了，谢谢
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
By4te: 卷积核的个数，决定了当前层输出特征图的深度
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
青青子佩983: 问一下卷积操作的时候为什么是6个5*5的卷积核
C++学习笔记（Ⅳ）：职工管理系统
By4te: 理解： 3节：创建WorkManager（职工管理函数），在头文件中声明，源文件中实现（包含构造和析构函数）。此函数中包含各类功能函数。 4节：菜单展示函数 5节：创建管理函数下的实例，提供菜单选择功能；实现菜单退出功能 6节：创建Worker抽象类（父类），提供父类行为纯虚函数及属性；创建employee、manager、boss子类，并进行属性初始化，提供父类纯虚函数的实现； 7节：头文件声明，源文件实现添加职工函数 8节：析构函数释放堆区内容；添加文件保存函数 9节：以不同方式读取文件 10节：显示职工信息 11节：删除职工 12节：修改职工信息 13节：查找职工 14节：排序 15节：清空文件

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。