sqark sql练习之统计UV

最新推荐文章于 2023-01-11 10:34:33 发布

鸭梨山大哎

最新推荐文章于 2023-01-11 10:34:33 发布

阅读量492

点赞数

分类专栏： spark hive 文章标签： sparksql hive uv

本文链接：https://blog.csdn.net/u010711495/article/details/110199999

版权

spark 同时被 2 个专栏收录

121 篇文章 8 订阅

订阅专栏

hive

114 篇文章 14 订阅

订阅专栏

下面的数据分别是：日期，用户，关键词，地址，平台，型号

2017-03-13,leo,barbecue,beijing,android,1.0
2017-03-13,leo,barbecue,beijing,android,1.0
2017-03-13,leo,barbecue,beijing,android,1.0
2017-03-13,leo,cloth,beijing,android,1.0
2017-03-13,leo2,cloth,beijing,android,1.0
2017-03-13,jack,barbecue,shanghai,android,1.1
2017-03-13,leo,paper,beijing,ios,1.0
2017-03-13,tom,barbecue,beijing,android,1.2
2017-03-13,leo,cup,beijing,android,1.0
2017-03-13,mary,barbecue,beijing,android,1.2
2017-03-13,leo,barbecue,beijing,ios,1.3
2017-03-13,leo,cup,beijing,android,1.0
2017-03-13,leo1,cup,beijing,android,1.0
2017-03-13,leo2,cup,beijing,android,1.2
2017-03-13,leo3,cup,beijing,android,1.2
2017-03-13,leo4,cup,beijing,android,1.3

使用sparksql完成，查看每个关键词的uv量

CREATE TABLE IF NOT EXISTS UVTEST ( 
sdate date, 
suser String,
keyword String, 
address String, 
platform String,
version double
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
LOAD DATA LOCAL INPATH '/data/uvtest.txt' OVERWRITE INTO TABLE UVTEST;

答案

select keyword,count(distinct suser ) as uv
from uvtest
group by keyword;

sparksql

import org.apache.spark.sql.{DataFrame, SparkSession}

object HiveDemo extends App{
  private val session: SparkSession = SparkSession.builder().enableHiveSupport()
    .config("hive.exec.dynamic.partition.mode","nonstrict")
    .master("local").appName("hive").getOrCreate()

  private val frame: DataFrame = session.table("default.uvtest")

  frame.createTempView("a")
  val sql=
    """
      |select
      |keyword,count(distinct suser) as uv
      |from uvtest
      |group by keyword
      |""".stripMargin
  session.sql(sql).show()
}

执行结果

| keyword| uv|
+--------+---+
|barbecue|  4|
|   paper|  1|
|     cup|  5|
|   cloth|  2|
+--------+---+

鸭梨山大哎

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
sqark sql练习之统计UV

下面的数据分别是：日期，用户，关键词，地址，平台，型号2017-03-13,leo,barbecue,beijing,android,1.02017-03-13,leo,barbecue,beijing,android,1.02017-03-13,leo,barbecue,beijing,android,1.02017-03-13,leo,cloth,beijing,android,1.02017-03-13,leo2,cloth,beijing,android,1.02017-03-13,ja
复制链接

扫一扫

专栏目录