1.现有数据量
2.日增长数据量
3.中间计算结果
4.各阶段数据存储时长
5.数据冗余空间。比如副本数
CPU和内存,总存储空间根据需求设定,集群间网络带宽要大,最好是内网。数据盘不用做raid,因为hadoop有备份数据的功能。
如果计算任务复杂且多,CPU需要高配。如果使用的大数据组件吃内存内存需要高配。
数据平台集群服务器数量节点数及存储容量等参数
最新推荐文章于 2021-08-05 09:16:57 发布
1.现有数据量
2.日增长数据量
3.中间计算结果
4.各阶段数据存储时长
5.数据冗余空间。比如副本数
CPU和内存,总存储空间根据需求设定,集群间网络带宽要大,最好是内网。数据盘不用做raid,因为hadoop有备份数据的功能。
如果计算任务复杂且多,CPU需要高配。如果使用的大数据组件吃内存内存需要高配。