Spark SQL--商品订单案例

最新推荐文章于 2024-07-13 00:08:49 发布

江南阁

最新推荐文章于 2024-07-13 00:08:49 发布

阅读量1.3k

点赞数 2

分类专栏： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36235275/article/details/82502533

版权

该博客探讨了如何使用Spark SQL进行商品订单的统计分析，包括每年销售单数和总额的计算、年度最大金额订单及最畅销货品的识别。通过在Scala中连接Hive并导入数据，借助Spark SQL完成对Hive表的操作，实现统计查询功能。

摘要由CSDN通过智能技术生成

需求

统计所有订单中每年的销售单数、销售总额
统计每年最大金额订单的销售额
统计每年最畅销货品（哪个货品销售额amount在当年最高，哪个就是最畅销货品）

image_1cml6v59u8p31c501bj97h31d859.png-64.1kB

我们首先需要在scala里连接hive，然后创建这三个表，导入数据。创建以及导入数据与操作Hive一致。在Spark SQL中，可以完全接管Hive，一切操作都可以在spark中实现。主要是将Hive的一个配置文件hive-site.xml导入到Spark的config配置中。

主要实现sql语句如下：

print("---------1、所有订单中每年的销售单数、销售总额------------")
  spark.sql("select c.theyear,count(distinct a.ordernumber),sum(b.amount) " +
    "from tbStock a join tbStockDetail b on a.ordernumber=b.ordernumber " +
    "join tbDate c on a.dateid=c.dateid group by c.theyear order by c.theyear")



  print("---------2.1、先求出每份订单的销售额以其发生时间----------")
  spark.sql("select a.dateid,a.

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

江南阁 CSDN认证博客专家 CSDN认证企业博客

码龄8年

33: 原创

19万+: 周排名

182万+: 总排名

3万+: 访问

: 等级

529: 积分

20: 粉丝

17: 获赞

4: 评论

37: 收藏

私信

关注

热门文章

分类专栏

Hadoop 1篇
模块功能 1篇
SSH 1篇
Linux 2篇
大数据 3篇
Spark 16篇
框架 1篇
Storm 2篇
Kafka 1篇
Hive 1篇
HBase 1篇
Node.js 2篇
SpringBoot 1篇
Elasticsearch
Java 2篇
shell 1篇
Redis

最新评论

Spark Streaming--2 自定义数据源
江南阁回复小邪2019: 原封不动复制过去运行即可，配置下本地的master，启动nc -lk master 8888，我刚看了没问题啊
Spark Streaming--2 自定义数据源
小邪2019: 老哥请问下你这样写不会报异常吗？我出现了序列化的异常，java.io.NotSerializableException: XxxReceiver
SSH框架搭建主要流程
小田世界第一好看: 有头没尾巴的，对小白来说好不友好，老鸟又不会看这个
SSH框架搭建主要流程
雨落无影: 大佬，666，整理的非常到位。 SSH框架xml版整合搭建图文教程：https://blog.csdn.net/songfei_dream/article/details/90753393 SSH框架注解版整合搭建图文教程：https://blog.csdn.net/songfei_dream/article/details/90753558

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。