最近课设外加生病,本来打算在上一篇机器学习使用k-近邻算法改进约会网站的配对效果。就打算写的一直没有时间。按照《机器学习实战》的流程,手写数字识别是kNN中的最后一部分,也是一个比较经典的案例。但是书中是直接使用32*32的二值化(只有1和0)数组进行计算的,书中也并没有讲解如何将手写数字转化为32*32的数组,这方面网上已经有很多资料了,所以只做了一个简单的二值化处理。
主要的流程就是将图片打开之后,进行降噪处理,然后将其灰度化,最后设置一个阙值将其二值化保存到一个32*32的数组中。
# @Time : 2017/12/15 18:11
# @Author : Leafage
# @File : imgTo01.py
# @Software: PyCharm
from PIL import Image
import matplotlib.pylab as plt
import numpy as np
def picTo01(filename):
"""
将图片转化为32*32像素的文件,用0 1表示
:param filename:
:return:
""&#