在这次比赛中,数据集分为几个文件,第一个是data图片数据集,大小不一并且有的是灰度图像,处理时要考虑种类;第二个是类别表格;第三个是图片名称对应的类别;在者是每种类别对应的数字编码0-19。处理时要匹配data图片读取顺序和表格中的数据。为了这个比赛先学的几天python所以在写代码的过程中很多都不懂,查阅了很多资料。
1.头文件
import os
import csv
import numpy as np
from scipy.misc import imread
import scipy.misc as misc
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from PIL import Image
from sklearn.decomposition import PCA
2.读取list.csv将每张图片的名称和类别数字读取出来,并且用dict字典对应,为的是后面读取图片时能够匹配。这里我用了list先存储,之后再转为numpy。
对csv文件读取参考https://www.cnblogs.com/liujinhong/p/5937527.html
https://www.cnblogs.com/unnameable/p/7366437.html
x = []
y = []
dic = dict()
#get the classes
with open('list.csv',mode='r',encoding='utf-8') as f:
csv_reader = csv.reader(f)
for row in csv_reader: