RNN预测

最新推荐文章于 2024-07-29 08:53:35 发布

Crazy - ?

最新推荐文章于 2024-07-29 08:53:35 发布

阅读量1.3k

点赞数

文章标签： pytorch

本文链接：https://blog.csdn.net/weixin_46310125/article/details/104342689

版权

这篇博客介绍了使用RNN进行文本预测的实践过程，包括RNN的基本原理、训练情况和基本思路框架。作者通过编码、分批处理数据、建立LSTM模型并训练，最后展示了不太满意的结果，表达了对提升预测效果的期望。

摘要由CSDN通过智能技术生成

RNN循环神经网络

实现文本预测

RNN原理：

A -> Model -> B -> Model -> C -> …

所形成的句子[A, B, C, …]

先看结果：
预测 -> "不分开"
不分开还知道多难你心烦叫你也才有些天别爱着还是说外场米渐我知道自己会太多走不走一颗三废都不要我手这样也和义自己的受伤让我刮小用往只要女生活能记不多那果有在想要你们过去我不能怕做你否定不你脑诉为要承透融必我遇见你还是微笑自然却没要让你看着我想知到你去一遍想办得模样我不开小情掉在我情球断于的弦再怎么接又上不见你很快化没是我不能听多久如果说你的一样伴

训练情况：
在这里插入图片描述

结果是挺不满意的，毕竟理解不是很深

基本思路框架

和以前线性模型比较相似

加载数据 – 处理数据
设置独热编码
分批数据
建立模型
训练模型
预测

正常导包

import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F

加载数据，自己找篇文章啥的都可以
提前把"\n"和"\t"这两个字符转为空格
设置可以由文字转数字，数字转文字的字典
encoded 就是我们的训练数据，也就是一列表的的数字，方便onehot矩阵的实现

with open("../input/jaychou_lyrics4703/jaychou_lyrics.txt", "r", encoding="utf-8") as f:
    text = f.readlines()
text = "".join(text).replace("\n", " ").replace("\t", " ")[:30000]

char = list(set(text))
char_to_int = {
   c: i for i, c in enumerate(char)}
int_to_char = {
   i: c for i, c in enumerate(char)}

vocab_size = len(char_to_int)

encoded = [char_to_int[i] for i in text]

onehot 将输入的文本（刚刚已经转成数字了）实现成矩阵，以便训练
onehot会输出一个二维矩阵
例： {a: 0, b: 1, c: 2}
input = “bac”
return [[0, 1, 0],
[1, 0, 0],
[0, 0, 1]]

def one_hot(text, n_class):
    """
        text: 序列串， tensor
        n_class: chars(dict) 长度
    """
    res = torch.zeros(text.shape

最低0.47元/天解锁文章

Crazy - ?

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫