【深度学习】-softmax回归

最新推荐文章于 2023-12-11 23:06:39 发布

勤奋努力的野指针

最新推荐文章于 2023-12-11 23:06:39 发布

阅读量334

点赞数

分类专栏： python 文章标签：深度学习回归 python

本文链接：https://blog.csdn.net/suolong1/article/details/124849013

版权

本文深入探讨了softmax回归在多类分类任务中的应用，包括MNIST手写数字识别、ImageNet自然物体分类和Kaggle分类问题。讲解了从回归到多类分类的转变，介绍了softmax函数、交叉熵损失以及如何从零开始实现softmax回归。同时，展示了使用深度学习框架简化softmax回归模型的训练过程，并给出了实际图像分类的示例。

摘要由CSDN通过智能技术生成

学习来源：李沐老师

softmax回归

回归vs分类

回归估计一个连续值
分类预测一个离散类别

MINIST：手写数字识别
ImageNet：自然物体分类

Kaggle上的分类问题
将人类蛋白质显微镜图片分为28类
将恶意软件分成9个类别
将恶意的Wikipedia评论分成7类

从回归到多类分类

回归
- 单连续数值输出
- 自然区间R
- 跟真实值的区别作为损失
分类
- 通常多个输出
- 输出是预测为第i类的置信度

均方损失

对类别进行一位有效编码
使用均方损失训练
最大值最为预测

无校验比例

对类别进行一位有效编码
最大值最为预测
需要更置信的识别正确类（大余量）

校验比例

输出匹配概率（非负，和为1）
概率y和 $\hat{y}$ 的区别作为损失

softmax和交叉熵损失

总结：

softmax回归是一个多类分类模型
使用softmax操作子得到每个类的预测置信度
使用交叉熵来衡量预测和标号的区别

损失函数

L2 Loss
$l(y,y')=\frac{1}{2}(y-y')^2$

L1 Loss
$l (y, y^{'}) = ∣ y - y^{'} ∣$

Huber’s Robust Loss

图片数据集分类

MNIST数据集是图像分类中广泛使用的数据集之一，但作为基准数据集过于简单。我们将使用类似但更为复杂的Fashion-MNIST数据集

%matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l

d2l.use_svg_display()

通过框架中的内置函数将Fashion-MINIST数据集下载读取到内存中

# 通过ToTensor实例将图像数据从PIL类型变换成32位浮点数格式，
# 并除以255使得所有像素的数值均在0到1之间
trans = transforms.ToTensor()
mnist_train = torchvision.datasets.FashionMNIST(
    root="../data", train=True, transform=trans, download=True)
mnist_test = torchvision.datasets.FashionMNIST(
    root="../data", train=False, transform=trans, download=True)

len(mnist_train), len(mnist_test)

(60000, 10000)

mnist_train[0][0].shape

torch.Size([1, 28, 28])

两个可视化数据集得函数

def get_fashion_mnist_labels(labels):  #@save
    """返回Fashion-MNIST数据集的文本标签"""
    text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat',
                   'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']
    return [text_labels[int(i)] for i in labels]

def show_images(imgs, num_rows, num_cols, titles=None, scale

最低0.47元/天解锁文章

勤奋努力的野指针

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【深度学习】-softmax回归

学习来源：李沐老师softmax回归回归vs分类回归估计一个连续值分类预测一个离散类别MINIST：手写数字识别ImageNet：自然物体分类Kaggle上的分类问题将人类蛋白质显微镜图片分为28类将恶意软件分成9个类别将恶意的Wikipedia评论分成7类从回归到多类分类回归单连续数值输出自然区间R跟真实值的区别作为损失分类通常多个输出输出是预测为第i类的置信度均方损失对类别进行一位有效编码使用均方损失训练最大值最为预测无校验比例
复制链接

扫一扫