CNN卷积神经网络CIFAR-10图片分类

最新推荐文章于 2024-08-01 14:05:32 发布

To beTheOne

最新推荐文章于 2024-08-01 14:05:32 发布

阅读量2k

点赞数 1

分类专栏： # TensorFlow 文章标签：神经网络 tensorflow python 机器学习

本文链接：https://blog.csdn.net/weixin_43222209/article/details/103539475

版权

这篇博客介绍了使用卷积神经网络（CNN）对CIFAR-10数据集进行图像分类的实践，模型结构类似Alex Krizhevsky的设计，经过训练在GPU上达到86%的最高精度。文章涵盖数据加载、模型构建、损失函数、训练过程，并指出未对数据预处理导致准确率仅50%+。

摘要由CSDN通过智能技术生成

概述

对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题，其任务是对一组32x32RGB的图像进行分类，这些图像涵盖了10个类别：
飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船以及卡车。

在这里插入图片描述

模型结构

本教程中的模型是一个多层架构，由卷积层和非线性层(nonlinearities)交替多次排列后构成。这些层最终通过全连通层对接到softmax分类器上。这一模型除了最顶部的几层外，基本跟Alex Krizhevsky提出的模型一致。
在一个GPU上经过几个小时的训练后，该模型达到了最高86%的精度。细节请查看下面的描述以及代码。模型中包含了1,068,298个学习参数，分类一副图像需要大概19.5M个乘加操作。

模型包括：

CIFAR-10 网络模型部分的代码位于 cifar10.py. 完整的训练图中包含约765个操作。但是我们发现通过下面的模块来构造训练图可以最大限度的提高代码复用率:
模型输入: 包括inputs() 、 distorted_inputs()等一些操作，分别用于读取CIFAR的图像并进行预处理，做为后续评估和训练的输入；
模型预测: 包括inference()等一些操作，用于进行统计计算，比如在提供的图像进行分类； adds operations that perform inference, i.e. classification, on supplied images.
模型训练: 包括loss() and train()等一些操作，用于计算损失、计算梯度、进行变量更新以及呈现最终结果。

import numpy as np

# 序列化和反序列化
import pickle

from sklearn.preprocessing import OneHotEncoder

import warnings
warnings.filterwarnings('ignore')

import tensorflow as tf

数据加载

def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='ISO-8859-1')
    return dict

# def unpickle(file):
#     import pickle
#     with open(file, 'rb') as fo:
#         dict = pickle.load(fo, encoding='bytes')
#     return dict

labels = []
X_train = []
for i in range(1,6):
    data = unpickle('./cifar-10-python/cifar-10-batches-py/data_batch_%d'%(i))
    labels.append(data['labels'])
    X_train.append(data['data'])
print(X_train[:1])
# 将list类型转换为ndarray
y_train = np.array(labels).reshape(-1)
X_train = np.array(X_train)

# reshape
X_train = X_train.reshape(-1,3072)

# 目标值概率
one_hot = OneHotEncoder()
y_train =one_hot.fit_transform(y_train.reshape(-1,1)).toarray()#转外概率 
display(X_train.shape,y_train