来源:字节跳动白泉的分享 作者:大数据技术与架构整理
大数据技术与架构 点击右侧关注,大数据开发领域最强公众号!
暴走大数据 点击右侧关注,暴走大数据!
By
大数据技术与架构
场景描述: 面对大量复杂的数据分析需求,提供一套稳定、高效、便捷的企业级查询分析服务具有重大意义。本次演讲介绍了字节跳动基于SparkSQL建设大数据查询统一服务TQS(Toutiao Query Service)的一些实践以及在执行计划调优、数据读取剪枝、SQL兼容性等方面对SparkSQL引擎的一些优化。
关键词:SparkSQL优化 字节跳动
本文是根据来自字节跳动的分享整理而成。
作者来自字节跳动数据平台查询分析团队。
目标和能力
为公司内部提供 Hive 、 Spark - SQL 等 OLAP 查询引擎服务支持。提供全公司大数据查询的统一服务入口,支持丰富的API接口,覆盖Adhoc、ETL等SQL查询需求
支持多引擎的智能路由、参数的动态优化
Spark-SQL/Hive引擎性能优化