机器学习实战之0-9手写字识别

嗯 觉得自己很棒棒哦 总之进步挺大的 哈哈哈哈
0-9的数字识别 属于多分类问题 需要用到softmax分类的知识 具体讲解请参考下面几个博客:
1
2
3
4

首先有两个数据集 训练集和测试集,两个数据集都有txt文件 如0_0.txt表示该txt文件属于第0类 后面的0表示该类别下的一个训练样本 其实每一个txt文件都是一个样本而且里边的32*32维(1024)的数字代表特征,假设每一个类别都含有80个样本(txt文件),那么总共训练集的特征 800*1024

所以需要把每一个txt在文件读取时都存成一个含有1024个特征的列表 在把所有的txt文件存成一个大的矩阵 总共包括800个样本 每一个样本1024个特征
对于每一个样本也把其对应的label存成800*1的矩阵
这里需要说明一下本次处理 把所有的数据都处理成矩阵了 便于后续进行运算,所以需要特别注意维数 以及矩阵的操作 关于numpy 数组 矩阵的相关知识可以参考其他博客
只要足够细心,基础扎实就可以。

数据集在这里: 解压一下放在指定路径就可以
链接:https://pan.baidu.com/s/1NYYwz55eJPOOE48V6Majig 密码:l6i0

接下来直接上代码(python)

# -*- coding: utf-8 -*-
"""
Created on Thu Mar 29 13:59:05 2018

@author: xuanxuan
"""

#手写数字识别 (自己写的) 纯粹练习所用
import numpy as np
import random

#首先导入数据
def getdata(filename0):  #filename0主要是一个参数 根据训练集和测试集的路径不一样  传入的参数也不一样
    dataarr=[]
    labelarr=[]
    for i 
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值