大模型计算图理解

Ai玩家hly

于 2024-08-09 21:30:56 发布

阅读量381

点赞数 4

文章标签：计算图大模型模型本质

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45003504/article/details/141071469

版权

请添加图片描述
解释:
这张图展示了一个简单的卷积神经网络 (CNN) 的计算图，它由以下几个部分组成：

节点：
箭头表示数据的流动方向。
节点名称表示具体的计算操作，如 ConvolutionBackward0、MaxPool2DWithIndicesBackward0、ReluBackward0 等。
节点下方的文字表示相关的参数，如 conv1.weight、conv1.bias、fc1.weight 等。
参数：
参数名后面括号内的数字表示参数的形状，如 (10, 1, 5, 5)、(20, 10, 5, 5)、(50, 320) 等。
图片的意义
这张图展示了模型的反向传播过程，也就是计算梯度的过程。具体来说：

ConvolutionBackward0：
这些节点表示卷积层的反向传播过程。
它们负责计算卷积层的梯度。
MaxPool2DWithIndicesBackward0：
这些节点表示最大池化层的反向传播过程。
它们负责计算最大池化层的梯度。
ReluBackward0：
这些节点表示激活函数（ReLU）的反向传播过程。
它们负责计算激活函数的梯度。
ViewBackward0：
这些节点表示视图操作的反向传播过程。
它们负责计算视图操作的梯度。
AddmmBackward0：
这些节点表示矩阵相加和矩阵乘法的反向传播过程。
它们负责计算矩阵相加和矩阵乘法的梯度。
LogSoftmaxBackward0：
这个节点表示 LogSoftmax 函数的反向传播过程。
它负责计算 LogSoftmax 函数的梯度。
图片的作用
这张图的主要作用是帮助理解模型的反向传播过程，特别是梯度计算的方式。通过这张图，我们可以看到：

数据如何从输出层逆向传播到输入层。
梯度如何计算出来，并分配给相应的参数。
各种操作（如卷积、池化、激活函数等）如何影响梯度的计算。

博客等级

码龄6年

106
原创

1023
点赞

852
收藏

1024
粉丝

关注

私信

热门文章

分类专栏

机器学习付费

最新评论

前端常用工程目录结构以及作用
橘梗: 您好，请问下截图中使用的是什么软件呢
AI行业应用前沿网站汇总
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python中日志怎么配置与使用
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ai玩家hly 年少且带锋芒,擅行侠仗义之事

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。