2020.4.14,RNN简单学习

本文介绍了循环神经网络RNN的基本概念,包括其在处理序列问题中的优势,以及Word Embedding方法,如Word2Vec和Glove。还讨论了RNN的情感分析应用和一致性记忆机制,并概述了RNN的数学形式。
摘要由CSDN通过智能技术生成

循环神经网络(Recurrent Neural Network)

注意用来处理序列问题(Sequence)

Sequence embedding ==>> [b, seq_len, feature_len] # b个句子,每个句子数量seq_len,每个单词为feature_len的长度。

要理解在大文本的数据集中为什么要选用word embedding这种方法,而不是用one-hot编码。
主是是one-hot编码有如下几个缺点:

  • spare,在处理较多文本数据集的时候会有较多的位置为0
  • high-dim,一段文本基本上都有成百上千个单词
  • semantic,one-hot编码不能满足语言相关性
  • trainable,都是1怎么训练啊。。。

常用Embedding方法,Word2Vec和Glove

Word Embedding

将一系列单词转换为向量空间
在这里插入图片描述
这里的index就是词表中单词的映射,比如0代表love,1代表you,等等,所以在将文本转换成num时一般用dict会比较常见。

Embedding Layer: Random initialized embedding

import tensorflow as tf
from tensorflow import keras

x = tf.range(5)
x = tf.random.shuffle(x)
net = keras.layers.Embedding(10, 4)        # 第一个为总单词的数量,第二个为每个单词的长度,这里注意因为embedding有10个单词,所以需要embedding的单词向量不得有大于10的数,否则会报错。比如这里传入的x为 tf.range(3, 12)就会报错
net(x)                # return的shape为[5, 4],随机化的embedding,后期经过神经网络可以训练优化数值

# net另外一些方法
net.trainable
net.trainable_variables             # net是可以多次使用的,这里返回时[10, 4]的矩阵

Sentiment Analysis(情感分析)

在这里插入图片描述

Consistent memory

在这里插入图片描述将所有的信息传递下去,模范人的语义理解常见,这里H5包含了从h1到h5的信息量,最终用于预测。
这里也用到CNN中权值共享的思想。

RNN的数学形式

在这里插入图片描述
ht一般可以作为最后的输入,其输出方式各种各样,也可做一次全连接层再作为输出。
循环神经网络常用tanh函数作为激活函数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值