Spark sql test

最新推荐文章于 2022-09-09 15:02:49 发布

wankunde

最新推荐文章于 2022-09-09 15:02:49 发布

阅读量1k

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/wankunde/article/details/47611635

版权

69 篇文章 7 订阅

订阅专栏

table scan

select count(1) from dmp.trait_zamplus_supply_v2;

Table message

* Test result :

dimentions	MapReduce	Spark Test1	Spark Test2
use cores	about 400	400	400
Time Spent (seconds)	181.089	313.455	71.575

Average Map Time 25sec
Average Shuffle Time 56sec

Total Time Across All Tasks: 5.9 h
Input Size / Records: 296.7 GB / 1795165725
Shuffle Write: 72.7 KB / 2400

Total Time Across All Tasks: 4.2 h
Input Size / Records: 296.7 GB / 1795165725
Shuffle Write: 72.7 KB / 2400

Note
Our hadoop block size is 64M.In hive I set mapreduce.input.fileinputformat.split.maxsize to 256000000. Spark test1 set mapred.max.split.size=64M and Spark test2 set mapred.max.split.size=256000000.

关注

专栏目录