matlab手写数字识别_MNIST手写数字识别

本文通过MATLAB处理MNIST手写数字识别数据集,探讨了数据探查、分割与标准化,并分别使用LogisticRegression和DecisionTreeClassifier模型进行训练。结果显示,LogisticRegression在识别效果上优于DecisionTree,同时强调了模型保存时需要注意标准化公式的重要性。
摘要由CSDN通过智能技术生成

项目背景

MNIST 数据集是经典的手写数字识别数据集,每个样本28*28。如图所示 data set download

93fc64fe49b99dbf4fae9d4cad3462a3.png
dataset template
  • 精简版MNIST:一共1797个样本,每个样本8*8,sklearn自带
  • 完整版MNIST:一共6万个样本(5万个训练,1万个测试),每个样本28*28

数据探查

# -*- coding: utf-8 -*-
from sklearn.datasets import load_digits # 精简版MNIST
from sklearn import preprocessing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier, export_graphviz
digits = load_digits()
print(type(digits))  # Bunch类是字典的子类,所以继承了字典的方法
print('字典的 key:',digits.keys())

字典的 key: dict_keys(['data', 'target', 'target_names', 'images', 'DESCR'])
print('数据集大小:{}\n图片数组:{}\n图片标签:{}\n标签类别:{}'.format(
    digits.data.shape,digits.target.shape,digits.images.shape,digits.target_names))
数据集大小:(1797, 64)
图片数组:(1797,)
图片标签:(1797, 8, 8)
标签类别:[0 1 2 3 4 5 6 7 8 9]
digits.images[0]
array([[ 0.,  0.,  5., 13.,  9.,  1.,  0.,  0.],
[ 0., 0., 13., 15., 10., 15., 5., 0.],
[ 0., 3., 15., 2., 0., 11., 8., 0.],
[ 0., 4., 12., 0., 0., 8., 8., 0.],
[ 0., 5., 8., 0., 0., 9., 8., 0.],
[ 0., 4., 11., 0., 1., 12., 7., 0.],
[ 0., 2., 14., 5., 10., 12., 0., 0.],
[ 0., 0., 6., 13., 10., 0., 0., 0.]])
# 为图像数据拉平后数据,每条记录一个图片
digits.data[0]
array([ 0.,  0.,  5., 13.,  9.,  1.,  0.,  0.,  0.,  0., 13., 15., 10.,
15., 5., 0., 0., 3., 15., 2., 0., 11., 8., 0., 0., 4.,
12., 0., 0., 8., 8., 0., 0., 5., 8., 0., 0., 9., 8.,
0., 0., 4., 11., 0., 1., 12., 7., 0., 0., 2., 14., 5.,
10., 12., 0., 0., 0., 0., 6., 13., 10., 0., 0., 0.])
# 图片查看
import matplotlib.pyplot as plt
n = 1001
p
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值