测试:
select count(1) from user;
1.9亿条数据
1、 1台namenode+8台datanode,耗时54秒
2、将其中的一台datanode装三个虚拟机,改为:1台namenode+8台实际的datanode+3台虚拟机的datanode,耗时96秒
多台虚拟机作为多个datanode节点并不能改善数据处理性能,反而会造成数据倾斜,性能更差
测试:
select count(1) from user;
1.9亿条数据
1、 1台namenode+8台datanode,耗时54秒
2、将其中的一台datanode装三个虚拟机,改为:1台namenode+8台实际的datanode+3台虚拟机的datanode,耗时96秒
多台虚拟机作为多个datanode节点并不能改善数据处理性能,反而会造成数据倾斜,性能更差