利用RNN构建语言模型

本文介绍了如何利用RNN(循环神经网络)构建语言模型,详细讲解了RNN的输入输出机制,网络参数定义,以及训练过程。通过PyTorch实现,包括RNN网络结构的设定、预测函数和训练函数的定义。
摘要由CSDN通过智能技术生成

这里省略了文本数据和数据集构建。具体可以查看这里。(这个是之前我按照李沐老师的课写的)

RNN输入输出

输入为当前向量 x x x(词),输出为预测向量 y y y。隐藏状态设为 h h h。其和上一个输入和上一个隐藏状态相关。RNN具体输入输出公式为:
h t = ϕ ( x t W x h + h t − 1 W h h + b h ) y t = ϕ ( h t W h y + b y ) h_t = \phi( x_tW_{xh}+h_{t-1}W_{hh}+b_h)\\ y_t = \phi(h_tW_{hy}+b_y) ht=ϕ(xtWxh+ht1Whh+bh)y

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值