mybatis 第一次执行sql语句慢_PySpark 之批量执行SQL语句

最新推荐文章于 2024-03-16 10:43:00 发布

weixin_39593718

最新推荐文章于 2024-03-16 10:43:00 发布

阅读量195

点赞数

文章标签： mybatis 第一次执行sql语句慢

本文链接：https://blog.csdn.net/weixin_39593718/article/details/111645192

版权

客户的一些复杂分析以PostgreSQL的存储过程实现，由于数据比较大，执行速度很慢，在决定用PySpark重写的时候，碰到这样一个问题，Spark SQL不支持执行多语句SQL，更不支持存储过程，如果把每个sql都用spark.sql来写，代码会变得很臃肿，另外如果sql发生改动，还需要改写Python代码，有没有简单的办法来执行一个包含多语句的sql脚本，就像spark-sql那样呢？

假设我们有这样一个包含多条sql语句的脚本，名字叫length_of_play.sql，

DROP VIEW IF EXISTS shakespeare;-- Read all of Shakespeare's playsCREATE TEMPORARY VIEW shakespeare  USING parquet  OPTIONS (path "data/shakespeare.gz.parquet");-- Print the table schema and additional informations to the consoleDESCRIBE EXTENDED shakespeare;-- Calculate number of lines of each work and print to the consoleSELECT play_name, count(line_id) AS lines  FROM shakespeare  GROUP BY play_name  ORDER BY lines DESC  LIMIT 20;-- Save the result as one file in JSON Lines formatDROP

最低0.47元/天解锁文章

weixin_39593718

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mybatis 第一次执行sql语句慢_PySpark 之批量执行SQL语句

客户的一些复杂分析以PostgreSQL的存储过程实现，由于数据比较大，执行速度很慢，在决定用PySpark重写的时候，碰到这样一个问题，Spark SQL不支持执行多语句SQL，更不支持存储过程，如果把每个sql都用spark.sql来写，代码会变得很臃肿，另外如果sql发生改动，还需要改写Python代码，有没有简单的办法来执行一个包含多语句的sql脚本，就像spark-sql那样呢...
复制链接

扫一扫