python读取图像数据_用python读取cifar-10图像数据

有很多机器学习的公开数据都需要手工编码读取,当然自己写代码读取是机器学习应用的基本能力,这里为了大家方便开发代码,避免重复发明轮子。

关于cifar数据集,点击这里,因为其下载比较慢,所以可以用csdn的下载地址下载cifar-10,cifar-10 csdn地址

下载后将其解压,如路径为: /xxx/cifar-10-batches-py/

代码很简单没有写注释,读取代码如下:

import cPickle

import numpy as np

import os

class Cifar10DataReader():

def __init__(self,cifar_folder,onehot=True):

self.cifar_folder=cifar_folder

self.onehot=onehot

self.data_index=1

self.read_next=True

self.data_label_train=None

self.data_label_test=None

self.batch_index=0

def unpickle(self,f):

fo = open(f, 'rb')

d = cPickle.load(fo)

fo.close()

return d

def next_train_data(self,batch_size=100):

assert 10000%batch_size==0,"10000%batch_size!=0"

rdata=None

rlabel=None

if self.read_next:

f=os.path.join(self.cifar_folder,"data_batch_%s"%(self.data_index))

print 'read: %s'%f

dic_train=self.unpickle(f)

self.data_label_train=zip(dic_train['data'],dic_train['labels'])#label 0~9

np.random.shuffle(self.data_label_train)

self.read_next=False

if self.data_index==5:

self.data_index=1

else:

self.data_index+=1

if self.batch_index

#print self.batch_index

datum=self.data_label_train[self.batch_index*batch_size:(self.batch_index+1)*batch_size]

self.batch_index+=1

rdata,rlabel=self._decode(datum,self.onehot)

else:

self.batch_index=0

self.read_next=True

return self.next_train_data(batch_size=batch_size)

return rdata,rlabel

def _decode(self,datum,onehot):

rdata=[]

rlabel=[]

if onehot:

for d,l in datum:

rdata.append(np.reshape(np.reshape(d,[3,1024]).T,[32,32,3]))

hot=np.zeros(10)

hot[int(l)]=1

rlabel.append(hot)

else:

for d,l in datum:

rdata.append(np.reshape(np.reshape(d,[3,1024]).T,[32,32,3]))

rlabel.append(int(l))

return rdata,rlabel

def next_test_data(self,batch_size=100):

if self.data_label_test is None:

f=os.path.join(self.cifar_folder,"test_batch")

print 'read: %s'%f

dic_test=self.unpickle(f)

data=dic_test['data']

labels=dic_test['labels']#0~9

self.data_label_test=zip(data,labels)

np.random.shuffle(self.data_label_test)

datum=self.data_label_test[0:batch_size]

return self._decode(datum,self.onehot)

if __name__=="__main__":

dr=Cifar10DataReader(cifar_folder="/xxx/cifar-10-batches-py/")

import matplotlib.pyplot as plt

d,l=dr.next_test_data()

print np.shape(d),np.shape(l)

plt.imshow(d[0])

plt.show()

for i in xrange(600):

d,l=dr.next_train_data(batch_size=100)

print np.shape(d),np.shape(l)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值