- 博客(5)
- 收藏
- 关注
原创 4*A100 80G 支持最大模型参数估计
注:以上采用粗略的估算方法:每 1B 个参数,占用4G显存(实际应该是10^9*4/1024/1024/1024=3.725G),如果考虑到实际推理时的激活值GPU显存占用,1B 参数所需要的显存应该比 4G 要大。
2024-10-25 20:08:27
1313
原创 Codeforces Round 976 Problem D. Connect the Dots
感觉本题动态规划还是蛮难想到的,挺有意思的一道题。
2024-10-05 19:51:22
2136
原创 Codeforces Round 976 Problem C. Bitwise Balancing
本题构建真值表,之后发现不合法情况,按位构建 a 的思路值得学习。
2024-10-04 22:28:35
1334
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅