cs231n作业（三）softmax分类

最新推荐文章于 2024-07-07 14:06:00 发布

wjp_ctt

最新推荐文章于 2024-07-07 14:06:00 发布

阅读量671

点赞数

分类专栏：深度学习文章标签：深度学习 cs231n python cifar10 计算机视觉

本文链接：https://blog.csdn.net/wjp_ctt/article/details/83048878

版权

本文介绍了CS231n课程的第三次作业，任务是使用softmax实现cifar10的多分类。作业涉及损失函数计算、梯度计算、交叉验证选择参数等，并通过代码展示了训练过程和测试结果。最佳参数组合为学习率0.005和正则化系数0.5，最终模型在测试集上的准确率为38.8%。

摘要由CSDN通过智能技术生成

一、作业说明

CS231n的第三次作业，要求写一个基于softmax的多分类程序，实现cifar10的多分类功能，程序中应当体现损失函数计算、梯度计算、交叉验证选择参数、权重可视化等功能。

本次作业与第二次作业的基于svm分类要求基本相同，唯一区别在于惩罚函数用的是softmax函数。

二、背景知识

损失函数

$L=-\frac{1}{N} \sum_{i=1}^{N}log(\frac{e^{s_{y_{i}}}}{ \sum e^{s_{j}}} )+\alpha R(W)$

损失函数分为两部分，前半部分的误差项 $-\frac{1}{N} \sum_{i=1}^{N}log(\frac{e^{s_{y_{i}}}}{ \sum e^{s_{j}}} )$ 和后半部分的正则项 $\alpha R(W)$ 。前半部分的误差由模型的输出层进行softmax运算结合交叉熵损失函数得到。后半部分的正则项提升了模型的泛化性能， $\alpha$ 是正则项系数，本模型中， R(W) 我们选用的是权重矩阵的F范数。

梯度计算

我们使用分析梯度计算方法。对于属于第 $y_{i}$ 类的输入样本 $x_{i}$ ，不考虑正则项，模型的loss关于W求梯度为

$\bigtriangledown_{w_{y_{i}}} L_{i}=\left ( \frac{e^{s_{y_{i}}}}{ \sum e^{s_{j}}}-1\right )x_{i}$

$\bigtriangledown_{w_{j}} L_{i}=\left ( \frac{e^{s_{j}}}{ \sum e^{s_{j}}}\right )x_{i}$

若 R(W) 为的F范数， $\bigtriangledown_W R(W)=W$

三、程序源码

# -*- coding: utf-8 -*-
"""
Created on Sun Oct 14 16:23:45 2018

@author: Junpeng
"""

import numpy as np
import random
from matplotlib import pylab as plt


#读取cifar10数据
def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='bytes')
    return dict

def sample_training_data(data, labels, num):
        batch_index= np.random.randint(0, data.shape[0], num)
        batch=data[batch_index].T
        batch_labels=labels[batch_index]
        return batch, batch_labels

def get_validation_set(k_fold, num_validation, training_data):
    num_training=np.size(training_data, 0)
    validation_set=random.sample(range(0,num_training),k_fold*num_validation)
    validation_set=np.reshape(validation_set,[num_validation, k_fold])
    return validation_set

#进行数据预处理（归一