《昇思25天学习打卡营第2天|02快速入门》

最新推荐文章于 2024-09-25 09:27:18 发布

hellozmz

最新推荐文章于 2024-09-25 09:27:18 发布

阅读量329

点赞数 5

文章标签：学习昇思打卡

本文链接：https://blog.csdn.net/hellozmz/article/details/140406147

版权

课程目标

这节课准备再学习下训练模型的基本流程，因此还是选择快速入门课程。

整体流程

整体介绍下流程：

数据处理
构建网络模型
训练模型
保存模型
加载模型
思路是比较清晰的，看来文档写的是比较连贯合理的。

数据处理

看数据也是手写体数据集的例子。
他们把数据都放存储了一份，可以通过设置获取到训练集合和测试集合。
构建了一个以64为一批的包：在这里插入图片描述
可以迭代获取到数据：

整体来说获取数据的部分还是比较清晰的。

网络构建

构建网络的方法和pytorch是比较接近的：
在这里插入图片描述
可以看出来，将数据先打平，然后放到全链接层，之后经过relu，再经过两个循环就构建好了网络。
模型的样子差不多是：

模型训练

在这里插入图片描述
通过截图可以看出来，损失函数和优化器都依次进行定义。注意这里使用的是交叉熵损失函数，所以要求的label是[batch_size]，logits是[batch_size, num_class]。
损失函数的实现逻辑：

import numpy as np

def softmax(logits):
    exp_logits = np.exp(logits - np.max(logits, axis=-1, keepdims=True))
    probs = exp_logits / np.sum(exp_logits, axis=-1, keepdims=True)
    return probs

def cross_entropy_loss(logits, labels):
    probs = softmax(logits)
    batch_size = logits.shape[0]
    
    # 取出正确类别的概率
    correct_log_probs = -np.log(probs[np.arange(batch_size), labels])
    
    # 计算平均损失
    loss = np.sum(correct_log_probs) / batch_size
    return loss

# 示例
logits = np.array([[2.0, 1.0, 0.1], [1.2, 0.9, 3.2], [0.5, 2.1, 0.3]])
labels = np.array([0, 2, 1])

loss = cross_entropy_loss(logits, labels)
print(f'Loss: {loss}')