神经网络与深度学习课程4-循环神经网络与NLP

一、序列模型

分类问题与预测问题

        图像分类:当前输入−>当前输出

        时间序列预测:当前+过去输入−>当前输出

二、数据预处理

2.1 特征编码

  • 数值特征不适合表示类别,因此一般使用独热编码
  • 国家编码从1开始,1~197,因为实际国籍有可能不填(对应0)
  • 使用199维特征向量表达一个人的特征。

2.2 文本处理

  • 按字母处理:将文本切分为字母序列
  • 按单词处理:将文本切分为单词序列

三、文本预处理与词嵌入

  1. 读取数据集。
  2. 词汇切分:将原始文本以文本行为单位进行切分。
  3. 构建词索引表:打印前几个高频词及索引并将每一条文本行转换成一个数字索引列表。

四、RNN模型

输入:The cat sat on the mat

模型结构:

结果:训练精度: 89.2%;验证精度: 84.3%;测试精度: 84.4%。

五、门控循环单元(GRU)

基本思想:不是每个观察都同等重要

基本结构:
总结:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值