- 博客(2)
- 收藏
- 关注
原创 学习周记2024.9.13~9.20
定义一个data_iter函数,该函数接收批量大小、特征矩阵和标签向量作为输入,生成大小为batch_size的小批量。并进行一系列操作和训练来通过梯度下降获取最优的w和b,最后输出训练的结果y的loss和参数w、b的loss。预测一个离散类别,通常有多个输出,输出的个数=类别的个数,输出的第i个元素是为了预测第i类的置信度。2、使用Softmax操作值可以得到每个类的预测置信度(是一个概率,非负),加起来和为1。估计一个连续值,输出是一个自然区间,将跟真实值的区别作为损失。图2.自动求导的两种模式。
2024-09-20 16:05:09 887
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人