引用Sean Robertson 的一个小例子:https://github.com/spro/practical-pytorch
环境
系统:win10
cpu:i7-6700HQ
gpu:gtx965m
python : 3.6
pytorch :0.3
数据集
下载地址:https://download.pytorch.org/tutorial/data.zip
下载之后解压,放在项目根目录:
数据集方面,我们要解决的问题有:转码问题,数据整合,每一个数据的表示形态(本文应用还是one-hot,每个字符的one-hot)
每个名字构建成 [字符数,1(batch数,因为不用故1),one-hot表示的字符位置]
# string.ascii_letters生成所有字母, string.digits 生成数字
all_letters = string.ascii_letters+" .,;'"
n_letters = len(all_letters)
print(n_letters)
# >>57
转码部分,我也不是很懂这些,NFD、Mn应该都是代表编码种类把,作用是把所有名字都转化一种编码模式:
# unicode 转 标准ASCII编码
def unicode_to_ascii(s):
s = "".join(c for c