1.3.Softmax回归

lsslcj

已于 2024-07-15 14:56:10 修改

阅读量2k

点赞数 45

分类专栏： ai相关文章标签：回归人工智能深度学习

于 2024-07-12 08:00:00 首次发布

本文链接：https://blog.csdn.net/shiki217_/article/details/140362918

版权

ai相关专栏收录该内容

48 篇文章 1 订阅

订阅专栏

回归和分类

回归估计一个连续值

分类预测一个离散类别

Softmax回归实际是一个分类问题

在这里插入图片描述

从回归到多类分类

对类别进行一位有效编码

$y=[y_1,y_2,\cdots,y_n]^T$ ,如果是第i类，则值为1，否则为0

使用均方损失训练，最大值预测为(即softmax函数)
$\hat y = argmax_i\ o_i$
需要更置信的识别正确类(大余量)：

$o_y -o_i\ge \Delta(y,i)$

校验比例

输出匹配概率（非负，和为1）
$\hat y = softmax(o)\\ \hat y_i =\frac{exp(o_i)}{\sum_k exp(o_k)}$
概率 $y$ 和 $\hat y$ 的区别作为损失

交叉熵损失

交叉熵用来衡量两个概率的区别 $H(p,q)=\sum_i - p_ilog(q_i)$

将它作为损失函数：
$l(y,\hat y)=-\sum_i y_ilog\hat y_i = -log \hat y_y （假设是第y类）$
关心正确类的预测值

其梯度是真实概率和预测概率的区别
$\partial_{o_i}l(y,\hat y) =softmax(o)_i -y_i$

损失函数

均方损失(L2 Loss)

$l(y,y')=\frac 12 (y-y')^2$
在梯度下降时，预测值与真实值相差较远时，梯度会较大，但在离原点比较远时，可能并不希望有较大的梯度，这种情况下可以使用L1 Loss。

绝对值损失(L1 Loss)

$l (y, y^{'}) = ∣ y - y^{'} ∣$

好处就是，无论离原点多远，梯度下降时的导数都是正负1，但在比较接近时，可能就出现振荡了

Huber’s Robust Loss

结合两种的好处

读取多类分类的数据集

图像分类数据集

使用Fashion-MNIST数据集

import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l

# 看一下图片的形状

def get_fashion_mnist_labels(labels):
    """返回Fashion-MNIST数据集的文本标签"""
    text_labels = [
        't-shirt', 'trouser', 'pullover', 'dress', 'coat', 'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot'
    ]

    return [text_labels[int(i)] for i in labels]


def show_images(imgs, num_rows, num_cols, titles=None, scale=1.5):
    "画图"
    figsize = (num_cols * scale, num_rows * scale)
    fig, axes = d2l.plt.subplots(num_rows, num_cols, figsize=figsize)
    axes = axes.flatten()
    for i, (ax, img) in enumerate(zip(axes, imgs)):
        if torch.is_tensor(img):
            # 是图片张量
            ax.imshow(img.numpy())
        else:
            # PIL图片
            ax.imshow(img)
        ax.axes.get_xaxis().set_visible(False)
        ax.axes.get_yaxis().set_visible(False)
        if titles:
            ax.set_title(titles[i])
    d2l.plt.show()  # 加上show图片才会显示
    return axes


def get_dataloader_workers():
    '''使用4个进程来读取数据'''
    return 4


def load_data_fashion_mnist(batch_size, resize=None):  #resize可以改变图片的大小
    """下载Fashion-MNIST数据集，然后将其加载到内存中"""
    trans = [transforms.ToTensor()]# 将图片转换成tensor
# 将图片下载，train表示是训练数集，transform表示是tensor而不是图片，download表示从网上下载
    if resize:
        trans.insert(0, transforms.Resize(resize))
    trans = transforms.Compose(trans)
    # 将图片下载，train表示是训练数集，transform表示是tensor而不是图片，download表示从网上下载
    mnist_train = torchvision.datasets.FashionMNIST(
        root="./data", train=True, transform=trans, download=True)
    # 训练数据集的下载，则train是False
    mnist_test = torchvision.datasets.FashionMNIST(
        root="./data", train=False, transform=trans, download=True)
    print(len(mnist_train))
    print(len(mnist_test))
    print(mnist_train[0][0].shape)  # 黑白图片，所以channel为1，train[0]表示取第一个元素，第二个[0]表示是取图片，[1]表示取标签
    return (data.DataLoader(mnist_train, batch_size, shuffle=True,
                            num_workers=get_dataloader_workers()),
            data.DataLoader(mnist_test, batch_size, shuffle=False,
                            num_workers=get_dataloader_workers()))

d2l.use_svg_display()  # 使用svg来显示图片
# 通过ToTenseor实例将图像数据从PIL类型变换成32位浮点数格式
# 并除以255使得所有像素的值均在0到1之间

# 将数据集放进dataloader里面，指定一个batch_size，我们就可以得到一个批次的数据
X, y = next(iter(data.DataLoader(mnist_train, batch_size=18)))
# show_images(X.reshape(18, 28, 28), 2, 9, titles=get_fashion_mnist_labels(y))

batch_size = 256

train_iter = data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=get_dataloader_workers())
timer = d2l.Timer()
for X, y in train_iter:
    continue

print(f'{timer.stop():.2f} seconds')

lsslcj

关注

45
点赞
踩
45

收藏

觉得还不错? 一键收藏
0
评论
1.3.Softmax回归

在梯度下降时，预测值与真实值相差较远时，梯度会较大，但在离原点比较远时，可能并不希望有较大的梯度，这种情况下可以使用L1 Loss。好处就是，无论离原点多远，梯度下降时的导数都是正负1，但在比较接近时，可能就出现振荡了。使用均方损失训练，最大值预测为(即softmax函数)Softmax回归实际是一个分类问题。,如果是第i类，则值为1，否则为0。其梯度是真实概率和预测概率的区别。输出匹配概率（非负，和为1）交叉熵用来衡量两个概率的区别。关心正确类的预测值。分类预测一个离散类别。
复制链接

扫一扫

专栏目录