【AI学习】LLaMA模型的微调成本有几何？

最新推荐文章于 2025-02-11 20:04:54 发布

bylander

最新推荐文章于 2025-02-11 20:04:54 发布

阅读量1.1k

点赞数 5

分类专栏： AI学习文章标签：人工智能学习 llama 自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bylander/article/details/141368778

版权

在前面文章《LLaMA 系列模型的进化（二）》中提到了Stanford Alpaca模型。
Stanford Alpaca 基于LLaMA (7B) 进行微调，通过使用 Self-Instruct 方法借助大语言模型进行自动化的指令生成，Stanford Alpaca 生成了 52K 条指令遵循样例数据（Alpaca-52K）用于训练。
在这里插入图片描述
据说，这个训练成本不到600美元。那这个成本是如何计算的呢？
训练成本：在8个80GB A100 上训练了3个小时，不到100美元；
数据成本：生成数据使用OpenAl的API，500美元。这里就是通过使用 Self-Instruct 方法，使用了OpenAl的接口的调用成本。

在前面文章《英伟达ChipNeMo，一个领域大模型的训练案例》里，介绍了领域大模型的训练过程。如下图：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

bylander 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。