pytorch RNN实现分类

最新推荐文章于 2024-08-16 22:27:00 发布

Lzj000lzj

最新推荐文章于 2024-08-16 22:27:00 发布

阅读量3.9k

点赞数

分类专栏： pytorch nlp 文章标签： RNN

本文链接：https://blog.csdn.net/Lzj000lzj/article/details/94854533

版权

该博客详细介绍了如何使用PyTorch实现RNN进行数据分类，包括数据加载、预处理、网络构建和训练过程。

摘要由CSDN通过智能技术生成

数据加载(简单看)

from __future__ import unicode_literals, print_function, division
from io import open
import glob
import os
import torch
def findFiles(path): return glob.glob(path)

#print(findFiles('data/names/*.txt'))

import unicodedata
import string

all_letters = string.ascii_letters + " .,;'"
n_letters = len(all_letters)
print(all_letters,n_letters)
# Turn a Unicode string to plain ASCII, thanks to https://stackoverflow.com/a/518232/2809427
def unicodeToAscii(s):
    return ''.join(
        c for c in unicodedata.normalize('NFD', s)
        if unicodedata.category(c) != 'Mn'
        and c in all_letters
    )

print(unicodeToAscii('Ślusàrski'))

数据预处理（将人名按字符转化为tensor）

# Build the category_lines dictionary, a list of names per language
category_lines = {
   }#字典
all_categories = []

# Read a file and split into lines
def readLines(filename):
    lines = open(filename, encoding='utf-8').read().strip().split('\n')
    #print([unicodeToAscii(line) for line in lines])
    return [unicodeToAscii(line) for line in lines]

for filename in findFiles('data/names/*.txt'):
    category = os.path.splitext(os.path.basename(filename))[0]
    all_categories.append(category)
    lines = readLin