单模态模型配置以及花费时间
Second模型
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约24小时
- 使用4块3090跑的时间:大约28-30小时
PV-RCNN模型
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2-3天
- 使用4块3090跑的时间:大约2.5-3.5天
Voxel R-CNN模型
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2-3天
- 使用4块3090跑的时间:大约2.5-3.5天
PointPillars模型
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2-3天
- 使用4块3090跑的时间:大约2.5-3.5天
Transfusion模型
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2-3天
- 使用4块3090跑的时间:大约2.5-3.5天
VoxelNet模型
- GPU:4 Nvidia P100 GPUs
- 块数:4
- 训练时间:大约4-5天
- 使用4块3090跑的时间:大约7-8天
多模态模型配置以及花费时间
SFD模型
- 数据集:ScanNet
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2天
- 使用4块3090跑的时间:大约2.5-3天
Deep-Fusion模型
- 数据集:大规模3D物体检测竞赛(Large-Scale 3D Object Detection Challenge, LS3D)
- GPU:8 Nvidia Tesla V100 GPUs
- 块数:8
- 训练时间:大约10天
- 使用4块3090跑的时间:大约12-14天
Transfusion模型
- 数据集:KITTI
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2天
- 使用4块3090跑的时间:大约2.5-3天
CAT模型
- 数据集:ScanNet
- GPU:8 Nvidia Tesla V100 GPUs
- 块数:8
- 训练时间:大约1周
- 使用4块3090跑的时间:大约9-10天
Transfusion模型
- 数据集:KITTI
- GPU:8 Nvidia V100 GPUs
- 块数:8
- 训练时间:大约2天
- 使用4块3090跑的时间:大约2.5-3天
单模态模型花销补:
Voxel-RCNN
显卡推荐:Nvidia Tesla V100 32GB *2 训练时间:大约需要3-4天
SECOND
显卡推荐:Nvidia Tesla V100 32GB *2 或 Nvidia Titan RTX 24GB *2 训练时间:大约需要3-4天
PV-RCNN
显卡推荐:Nvidia Tesla V100 32GB *2 训练时间:大约需要5-6天
多模态模型花销补:
SFD
显卡推荐:Nvidia Tesla V100 32GB *4 或 Nvidia Titan RTX 24GB *4 训练时间:大约需要10天
TransFusion
显卡推荐:Nvidia Tesla V100 32GB *4 或 Nvidia Titan RTX 24GB *4 训练时间:大约需要10天
Deepfusion
显卡推荐:Nvidia Tesla V100 32GB *4 或 Nvidia Titan RTX 24GB *4 训练时间:大约需要10天
对于以上模型,需要的显卡类型和数目可以根据具体模型和数据量进行调整。建议使用 NVIDIA Tesla V100 或 NVIDIA Titan RTX 等高端显卡来加速训练过程。如果您的数据集规模较小,则可以考虑更低端的显卡。
如果你购买一台服务器,并想要训练这些模型,推荐配置是:
- CPU: Intel Xeon 6248 或更高版本
- 内存: 128 GB 或更高版本
- 存储: 2TB NVMe SSD或更高版本
- 显卡: Nvidia Tesla V100 32GB *4 或 Nvidia Titan RTX 24GB *4
如果使用云服务,则可以根据需要灵活选择云服务器的规格和数量,但成本可能会较高。相比之下,购买一台服务器可以使你长期拥有机器的所有控制权,并且节约云服务的成本。建议购买一台具有4个Nvidia 3090显卡的专业工作站,它们的性能非常强大且成本相对较低。
云服务的优点
- 可以根据需求灵活选择不同规格的GPU和服务器,并且能够随时升级或降低配置,按需付费。
- 不需要花费时间和精力去购买、安装和调试硬件设备,也不需要考虑维护、升级和更新硬件的问题。
- 可以享受云服务商提供的完善的安全保障和技术支持,如数据备份、防火墙、负载均衡等。
云服务的缺点
- 租用云服务需要付费,长期使用可能会有一定的成本压力。
- 云服务商提供的设备可能存在性能波动或资源竞争问题,导致训练结果不稳定。
- 长时间使用云服务可能会出现网络延迟和连接问题,对训练速度和效果造成一定影响。
自己购买4块3090的服务器的优点
- 相比于租用云服务,自己购买4块3090的服务器可以实现更高的性价比,长期使用成本更低,同时也能够根据自己的需求和预算自由搭配硬件配置。
- 自己购买的服务器可以得到更好的控制并且不受云服务商控制,训练可靠性较高。
- 购买自己的服务器不受云服务商的限制,可以在需要时进行硬件升级,完全确保训练所需资源。
自己购买4块3090的服务器的缺点
- 需要一定的成本用于购买硬件设备,还需要考虑到维护、升级和更新硬件的问题,这些都需要投入额外的时间和精力。
- 不像云服务商提供的设备,自己购买的设备无法享受云服务商提供的完善的安全保障和技术支持。
- 自己购买的服务器需要考虑到硬件的故障和维护问题,需要具备一定的硬件维护技术才能够快速维修和解决问题。
综上所述,从成本、灵活性和稳定性等多方面考虑,在短时间内选择租用云服务是一个更好的选择。当有长期需求且需要更高的性价比时,自己购买4块3090的服务器是更好的选择
云服务器平台
以下是几个中国用户常用于跑深度学习知名度和使用量高的云服务器平台,供您参考:
- 阿里云 阿里云是国内知名的云服务提供商之一,其提供的GPU实例种类丰富,包括NVIDIA Tesla V100、P40等多种型号,可以满足不同场景的深度学习需求。同时,阿里云也提供了多种深度学习框架支持,并且提供了容器镜像服务,方便用户进行深度学习模型的构建和部署。
- 腾讯云腾讯云也是国内知名的云服务提供商之一,在GPU实例类型上也提供了多种选择,包括NVIDIA Tesla V100、P40、T4等多种型号。并且,腾讯云提供了多种深度学习框架支持,如TensorFlow、PyTorch、Caffe等,并且支持使用Jupyter Notebook进行模型开发。
- 华为云 华为云也是国内的云服务提供商之一,其提供的GPU实例类型较全面,包括NVIDIA Tesla V100、P100、T4等多种型号,同时也提供了多种深度学习框架支持,如TensorFlow、PyTorch、Caffe等,并且支持使用自己的AI计算平台ModelArts进行深度学习模型的构建和部署。
以上是国内知名的云服务器平台,其中阿里云、腾讯云和华为云均提供了多种型号的GPU实例以及丰富的深度学习框架支持,可以满足不同场景的深度学习需求。
云平台相关信息和费用估算
- 阿里云 阿里云提供多种型号的GPU实例,包括NVIDIA Tesla V100、P40、V100等,也可以灵活配置4块3090显卡的GPU。单次租用2天4块3090显卡的ECS实例费用约为2464元,如果长期使用,需要考虑到每月的固定费用,例如每月使用64核128G内存4块P40显卡的ECS实例费用为25920元(一年约为311040元)。
- 腾讯云 腾讯云提供多种型号的GPU实例,包括NVIDIA Tesla V100、P40、T4等,也可以配置4块3090显卡的GPU。单次租用2天4块3090显卡的CVM实例费用约为2275元,如果长期使用,需要考虑到每月的固定费用,例如每月使用64核128G内存4块P40显卡的CVM实例费用为29520元(一年约为354240元)。
- 华为云 华为云提供多种型号的GPU实例,包括NVIDIA Tesla V100、P40、T4等,也可以配置4块3090显卡的GPU。单次租用2天4块3090显卡的ECS实例费用约为2670元,如果长期使用,需要考虑到每月的固定费用,例如每月使用56核112G内存4块V100显卡的ECS实例费用为34560元(一年约为414720元)。
- AutoDL AutoDL是一个基于AI的自动化深度学习平台,可以自动化实现模型选择、超参数调整等功能,并且支持多种深度学习框架和算法。AutoDL提供了包括GPU实例在内的多种计算资源类型,可以根据不同的需求选择不同的资源类型,包括4块3090显卡的GPU。根据官方公布的价格,单次使用4块3090显卡的训练服务费用约为2200元,使用周期越长,每日平均费用越低。
- 北京超级云计算中心 北京超级云计算中心是由北京市政府投资建设的大型云计算数据中心,提供了高性能计算、云计算服务等多种计算资源。北京超级云计算中心也提供了多种型号的GPU实例,包括NVIDIA Tesla V100、P40等,也可以配置4块3090显卡的GPU。根据官方公布的价格,单次租用4块3090显卡的主机费用约为953元,如果需要长期使用,需要与客户经理协商,并会有一定的折扣##
AutoDL:可以包日,高性能多个不好抢,4x3090价格还行440元。
3090有,三天需要440大概。
4090没有
阿里云:不能包日3天按小时需要5688,太贵。
腾讯云:也只能包月或年,按小时也很贵3天5040元
北京超级云计算中心
没有价格界面,师姐说4块3090一小时18元。算下来一次训练要1296。
18x24x3=1296。
总结:AutoDL最便宜,其他几家北京超算还能考虑。
AutoDL一次训练440元。
北京超级云计算中心一次训练要1296。
一个人AutoDL , 算下来跑10次实验,4400元。
接近5000。
一届两人
北京超级云计算中心
没有价格界面,师姐说4块3090一小时18元。算下来一次训练要1296。
18x24x3=1296。
总结:AutoDL最便宜,其他几家北京超算还能考虑。
AutoDL一次训练440元。
北京超级云计算中心一次训练要1296。
一个人AutoDL , 算下来跑10次实验,4400元。
接近5000。
一届两人
1W。每届1W元。速度是4台3090的速度。可能还要看有没有资源能租。