tensorflow从入门到放弃再到精通(3.1):认识手写数字图片训练集

前面我们了解了线性回归的问题,接下来认识一下分类的问题,其中一个典型问题就是教会机器识别图片中的物体。而在图片分类中,最简单的就是0~9 数字图片识别,他也是非常重要的,显示应用在邮政编码,快递单号,手机号码识别等。

机器学习是需要从数据之中学习的,因此我们需要大量真是样本数据。手写数字图片,也是真是由大量的真人手写的图片组成,为了方便存储和计算,一般会把收集到的原始图片保存在固定的大小(size或者shape)。比如96行和96列的(96*96)。一个图片的输入数据可计做x,同时需要为图片添加标签(label),也就是真实的值y。这个标签证明图片属于哪一个分类,一般通过这种映射方式将类别名一一对应到从0开始的编号数字中,举个例子:硬币的正面我们计做0,反面计做1。这种编码方式叫做数字编码。对于手写数字识别更为直观,我们直接用数字0~9来代替0~9每个的类别。

如果希望我们得到的模型在新输入的样本上面表现得很好,也就是说有很好的泛化能力,那我们就需要尽可能多的去增加数据集的规模和多样性。使我们用于学习的训练数据集与真是手写的数字图片分布的尽可能逼近,这样在训练后得到的模型就能很好的预测未见过的手写数字图片了。

为了方便业界统一测试和评估算法,就产生了手写数字图片数据集,命名为MNIST,共包含了0~9共10种数字的手写图片,每种数字有7000中不同的图片,其中6000章图片 为训练机(Training Set),用来训练模型,剩

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值