scikit-learn笔记 7 KNN手写数字识别

完整代码 sklearn代码4 3-KNN手写数字的识别

手写数字识别
导入需要的包模块

import numpy as np

import cv2

import matplotlib.pyplot as plt
%matplotlib inline

from sklearn.neighbors import KNeighborsClassifier

预览图片

# bitmap 位图
digit = cv2.imread('./u=123514531,1306365842&fm=26&fmt=auto.bmp')

plt.imshow(digit)

# 将(三维的)彩色图片转换为黑白的(图片灰度化处理):大大降低数据量
digit = cv2.cvtColor(digit,code = cv2.COLOR_BGR2GRAY)

# (391,500,3)  -----> (391,500)
# 数据量减少,只有原来的1/3
# 
digit.shape

在这里插入图片描述

代码遍历创建的图片文件并读取

X = []
for i in range(1,3):
    for j in range(1,7):
        digit = cv2.imread('./data/%d/%d.bmp'%(i,j))
        X.append(digit[:,:,0])

数据X与目标值y一一对应
X = np.asarray(X) #numpy对象
y = np.array([i for i in range(2)]*6)
y.sort()

在这里插入图片描述
随机选取图片并进行打印

# digit二维的,高度,维度,像素(只有一个值)-----用什么颜色表示呢
# 选择黑白,图片show就是黑白,rainbow显示出来,彩虹效果

index = np.random.randint(1,12,size = 1)[0]

digit = X[index]

print('-----------------------------',y[index])

plt.imshow(digit,cmap=plt.cm.gray)
y[:4]  #查看前4个图片

在这里插入图片描述

X,y划分成训练和验证数据

# 模型选择 可以打乱顺序 按照比例进行划分
from sklearn.model_selection import train_test_split

在这里插入图片描述

# test_size = 0.2 则 train_size = 0.8
# 训练:测试 = 4:1
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.2 )
X_test.shape

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值