什么是张量并行TP

愚昧之山绝望之谷开悟之坡

于 2024-08-29 14:43:02 发布

阅读量42

点赞数 1

分类专栏：人工智能术语文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15821487/article/details/141678506

版权

术语同时被 2 个专栏收录

448 篇文章 6 订阅

订阅专栏

49 篇文章 3 订阅

订阅专栏

这个参数是用于设置在进行张量并行（Tensor Parallelism，简称TP）时使用的GPU数量。张量并行是一种在多个GPU上分布和并行计算深度学习模型的方法，特别是用于大型模型，这些模型太大以至于不能在单个GPU的内存中完全容纳。

参数--tp TP中的TP表示参与张量并行的GPU数量。这里有几个关键点需要注意：

2^n：这意味着GPU的数量必须是2的幂次方，比如1、2、4、8、16等。这是因为张量并行通常在多个GPU上以一种树状结构或线性结构分布数据，2的幂次方可以方便地进行这种分布。
Default: 1：默认情况下，如果不设置这个参数，那么就只有1个GPU用于计算，也就是说没有启用张量并行。
Type: int：这个参数需要一个整数作为输入，表示使用的GPU数量。

通俗来说，如果你有一个非常大的神经网络模型，单个GPU的内存无法装下所有的模型参数，你就可以使用多个GPU来共同存储和计算这个模型。启用张量并行后，模型的不同部分会被分配到不同的GPU上，多个GPU协同工作，共同完成模型的训练或推理任务。而--tp TP参数就是用来告诉系统，你打算使用多少个GPU来共同完成这个任务。

愚昧之山绝望之谷开悟之坡

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
什么是张量并行TP

通俗来说，如果你有一个非常大的神经网络模型，单个GPU的内存无法装下所有的模型参数，你就可以使用多个GPU来共同存储和计算这个模型。启用张量并行后，模型的不同部分会被分配到不同的GPU上，多个GPU协同工作，共同完成模型的训练或推理任务。张量并行是一种在多个GPU上分布和并行计算深度学习模型的方法，特别是用于大型模型，这些模型太大以至于不能在单个GPU的内存中完全容纳。：默认情况下，如果不设置这个参数，那么就只有1个GPU用于计算，也就是说没有启用张量并行。表示参与张量并行的GPU数量。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。