本文主要向大家介绍了机器学习入门之机器学习初探(手写数字识别)matlab读取数据集,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。
手写数字识别是机器学习里面的一个经典问题,今天就这一段时间学习的机器学习,花一个下午茶的时间,试试机器学习。
首先数据库是在MNIST(http://yann.lecun.com/exdb/mnist/)下载下来的。下载下来的数据如下图所示。官方有给出数据怎么读取,我自己没有仔细看,因为我看到网上有人公布代码如何读取。
可以看到前四个是测试数据,后四个是训练数据。
这里我用matlab尝试读取这些数据。
首先看两个function。
loadMNISTImages.m
function images = loadMNISTImages(filename)
%loadMNISTImages returns a 28x28x[number of MNIST images] matrix containing
%the raw MNIST images
fp = fopen(filename, ‘rb‘);
assert(fp ~= -1, [‘Could not open ‘, filename, ‘‘]);
magic = fread(fp, 1, ‘int32‘, 0, ‘ieee-be‘);
assert(magic == 2051, [‘Bad magic number in ‘, filename, ‘‘]);
numImages = fread(fp, 1, ‘int32‘, 0, ‘ieee-be‘);
numRows = fread(fp, 1, ‘int32‘, 0, ‘ieee-be‘);