手写数字识别整体流程

手写数字识别整体流程

pytorch中数据加载
batch:数据打乱顺序,组成一波-波的数据,批处理
epoch:拿所有的数据训练一-次
Dataset基类,数据集类

  1. torch.utils.data.Dataset
    2.两个重要的方法:
    a._ getitem_ (index) 能够对实例进行索引
    b. _ len_ : len(实例)调用实例的_ len_ 方法
    迭代数据集
  2. torch.utils. data.DataLoader (dataset, batch. sieshuffle)
    手写数字识别的思路:
    1.准备数据,通过dataset和Datal oader准备
    2.模型构建
    3.模型训练,模型保存和加载
    4.模型的评估
    a.准备Mnist数据
    a. torchvision.transforms.ToTensor
    i.把ndarray转化为tensor
    ii. PIL中iamge对象对转化为tensor
    b. torchvision.transforms.Normlize(mean,str)
    i. mean, std的形状和通道数相同
    C. torchvision.transforms.Compose
    i.把不同的实例组合使用
    b.交叉熵损失
    a. nn.CrossEntropyLoss()
    b.使用带权损失计算交叉熵损失
    i. softmax(out)
    ii. output = F.log. softmax(out) #log(P)
    iv. F.nl loss(outputtarget) #- EY log§
    C.带权损失
    i. loss = -ZWixi
    C.训练
    a. 遍历dataloader
    b. tqdm(可迭代对象,total= 迭代总次数)
    d.模型的评估
    a.不需要计算梯度
    b.计算损失和准确率
    C.准确率的计算
    i.获取概率最大值的位置作为预测值
    ii.预测值和真实值判断相等,结果取均值
    文本分词
    N-gram:用连续的N个token左右-一个特征, N往往取2或者3.
    1.考虑了句子中词语的顺序
    文本向量化
  3. one-hot
  4. word emebdding:
    a.用一个向量表示每-一个词语,向量中的每个值都是参数,都会在后续通过训练得到
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值