![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大模型知识乱炖
文章平均质量分 82
kcarly
这个作者很懒,什么都没留下…
展开
-
大模型项目落地时,该如何估算模型所需GPU算力资源
大模型项目落地时,该如何估算模型所需GPU算力资源。在大模型项目落地前期沟通时,对于算力估算和采购方案许多小伙伴不太了解,在此对相关的算力估算和选择进行一些经验总结。原创 2024-06-22 10:45:54 · 1527 阅读 · 0 评论 -
大模型训练显卡选择
大模型训练时 A100 是首选 ,A40 用于推理,目前还推出了 H100 为下一代替换 A100 的产品。原创 2023-10-29 01:20:38 · 4777 阅读 · 0 评论 -
显卡算力扫盲篇(三)
GPU 的核心架构及参数NVIDIA GPU 的核心参数的差别和各自的优势原创 2023-10-29 01:13:41 · 3655 阅读 · 0 评论 -
显卡算力扫盲篇(二)
一提到 AI 计算,显卡性能,就有一大堆参数性能列表,这些列表全是一堆堆的参数数据,他们都代表啥?本文整理了常见的参数说明供大家了解。原创 2023-10-29 00:57:17 · 5782 阅读 · 0 评论 -
大模型训练要啥样配置,哪种硬件比较适合?
大模型训练的配置选择需要考虑计算资源、存储资源和分布式训练等因素。为了处理大规模的数据和复杂的模型结构,需要选择具有高性能的多核心CPU和高性能GPU的计算机。同时,需要足够的存储资源来存储大规模的数据集和模型参数,建议选择大容量、高速的存储设备。原创 2023-10-28 22:19:59 · 11922 阅读 · 2 评论 -
显卡算力扫盲篇(一)
算力,即计算能力,英文为Compute Capability,缩写为CC.计算能力是对计算水平高低的一个重要衡量指标,计算是一个抽象的概念,加减乘除是一种计算,三角函数是一种计算,微积分也是一种计算,在计算机领域,复杂的计算可以有多个简单的计算组合而成,为了描述计算能力,我们规定将一秒进行一次浮点运算的能力记为1(该处浮点数指单精度浮点数),即1FLOPS,其英文为FLoat point Operation Per Second。原创 2023-10-28 19:32:39 · 2847 阅读 · 0 评论 -
大模型是什么?该怎么训练?
大模型是指具有数百万或数十亿个参数的深度神经网络模型,经过专门的训练过程,能够对大规模数据进行复杂的处理和任务处理。大模型具有巨大的规模,通常包含数十亿个参数,模型大小可以达到数百GB甚至更大。大模型需要强大的计算资源和存储空间来保证它的训练和部署,训练大模型通常需要数百甚至上千个GPU,以及大量的时间,通常在几周到几个月。大模型拥有强大的表达能力和学习能力,可以学习到更广泛和泛化的语言理解能力。原创 2023-10-28 19:07:46 · 2670 阅读 · 0 评论