10w分区表,hive能跑,sparksql运行也完全能跑起来

 

1,问题来源:

对于有几个万分区的分区表,sparksql一跑就挂,但hive不会,请问怎么处理

执行sql:

ga10.coin_gain_lost是一个有几万个分区的分区表

date字段是一级分区

Caused by:org.apache.thrift.transport.TTransportException: Frame size (47350517) largerthan max length (16384000)!

         atorg.apache.spark.sql.hive.client.HiveTable.getAllPartitions(ClientInterface.scala:74)

         apache.hadoop.hive.metastore.api.ThriftHiveMetastore$Client.get_partitions(ThriftHiveMetastore.java:1979)

初步判断:spark把这个表的所有分区信息抓取回来(HiveTable.getAllPartitions),

 

补充说明:这个sql在hive中能正常跑     

内容资源: spark-sql --num-executors 6 --driver-memory 20g--executor-memory  18g --master yarn

查看spark界面,没有job生成,没有stage信息

 

 

2,问题重现测试

根据分区重现这个问题的步骤,进行spark测试

 

Ø  spark 测试运行环境:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

段智华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值