计算资源消耗

wenjurongyu

于 2024-08-13 18:03:59 发布

阅读量40

点赞数 1

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Akun_2217/article/details/141170364

版权

计算资源消耗

计算资源的消耗分成：

模型参数本身的存储。
模型参数的梯度以及梯度momentum的存储。
token的传播过程

例如以llama3-7b为例：

模型参数存储：模型参数量 * fp32
- 例如llama3-70b为例，7 * 10^9 * 4
模型参数的梯度以及momentum存储：模型参数量 * fp32 ; 模型参数量 * fp32
activition : 一个batch的token数量* embed维度 * 传播层数 * fp32

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算资源消耗

计算资源的消耗分成：例如以llama3-7b为例：
复制链接

扫一扫

wenjurongyu CSDN认证博客专家 CSDN认证企业博客

码龄5年

89: 原创

23万+: 周排名

2万+: 总排名

3万+: 访问

: 等级

1256: 积分

333: 粉丝

364: 获赞

16: 评论

337: 收藏

私信

关注

热门文章

分类专栏

最新评论

隐马尔可夫模型python实现。
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python-日志模块以及实际使用设计
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
libmysqlclient.so.18(libmysqlclient_18)(64bit)依赖解决
wenjurongyu: 没找到安装包目录。在win平台下载完之后，上传到linux指定目录，在linux指定目录下安装。
libmysqlclient.so.18(libmysqlclient_18)(64bit)依赖解决
qinglan22: 请问是在官网下载安装包吗，下载完在哪里运行命令呢，显示找不到路径
jupyter notebook-修改登录密码
CSDN-Ada助手: 恭喜你写了这么有用的一篇博客！学会修改jupyter notebook的登录密码真的很重要，谢谢你分享这个教程。希望你能继续分享更多关于jupyter notebook的使用技巧，比如如何优化代码编辑体验，或者如何利用插件提升工作效率。期待你的下一篇作品！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。