SFT数据构建时间

3333333_

已于 2024-09-14 09:32:37 修改

阅读量174

点赞数 1

分类专栏：大模型文章标签：人工智能大模型

于 2024-09-14 09:21:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wade1010/article/details/142248386

版权

大模型专栏收录该内容

11 篇文章 0 订阅

订阅专栏

24台服务器，每台服务器配置一张40G显存的A100

然后在另外一台节点上启动多进程处理32万条原始数据，32万条数据平均分配到24个节点，然后构造prompt，让Qwen产生QA问答对。

核心代码如下

chat_response = client.chat.completions.create(  
    model=model,  
    messages=[  
        {"role": "system", "content": "你是一个XXX行业数据集处理专家"},  
        {"role": "user", "content": content},  
    ],  
    max_tokens=4000  
)

耗时估算，大概每次请求耗时，平均下来10秒。

320000/24*12/3600/24=1.85天

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

3333333_ CSDN认证博客专家 CSDN认证企业博客

码龄14年

990: 原创

1万+: 周排名

3240: 总排名

57万+: 访问

: 等级

1万+: 积分

163: 粉丝

303: 获赞

70: 评论

770: 收藏

私信

关注

热门文章

分类专栏

大模型 11篇
后端 74篇
其它 27篇
区块链 3篇
Nginx 24篇
数据库 231篇
Golang 25篇
开发工具 13篇
c++ 230篇
rpc 21篇
存储 77篇
Ceph 2篇
Java 19篇
RDMA 2篇
s3fs 6篇
juicefs 5篇
goofys 5篇
MinIO 12篇
rust 44篇
webassembly 1篇
设计模式 3篇
Raft 1篇
SPDK 8篇
Linux 221篇
PHP 64篇
Redis 39篇
Python 3篇
Docker 18篇
前端 17篇

最新评论

docker搭建dify实操、使用
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
docker搭建dify实操、使用
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619277155。
vscode 使用code runner配置c++11
m0_74396294: nb，搜了三四个解决方案，这个管用
mc admin接口
3333333_: 大概看下源码吧，有地方判断了。你看下我说的所有评论
mc admin接口
3333333_: header

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。