#从io中导入打开方式
from io import open
#帮助使用正则表达式进行子目录的查询
import glob
import os
#用于获得常见字母及字符规范化
import string
import unicodedata
#导入随机工具
import random
#导入时间和数学工具包
import time
import math
#导入torch工具
import torch
#导入nn准备构建模型
import torch.nn as nn
#导入制图工具包
import matplotlib.pyplot as plt
- 第二步:对data文件中的数据进行处理,满足训练要求。
获取常用字符数量
#获取所有常用字符包括字母和常用标点
all_letters = string.ascii_letters + " .,;'"
#获取常用字符数量
n_letters =len(all_letters)
print("n_letter:",n_letters)
all_letters
- 字符规范化只unicode转Ascii函数
# 关于编码问题我们暂且不去考虑
#我们认为这个函数的作用就是去掉一些语言中的重音标