spark题目解析

最新推荐文章于 2024-03-21 19:19:12 发布

黄金角

最新推荐文章于 2024-03-21 19:19:12 发布

阅读量294

点赞数

本文链接：https://blog.csdn.net/huangjin529/article/details/108412332

版权

本文主要解析了一道关于Spark的数据处理题目，详细介绍了题目要求、数据格式和处理要点，并提供了相应的代码实现，涉及的技术栈包括JSON、Kafka和Redis。

摘要由CSDN通过智能技术生成

1.题目要求：

/**
 * 1. 根据这个Json文件统计手机用户用不同系统登录的次数
 * 2. 统计手机用户在各省登录的次数
 * 3. 将结果保存到Redis
 * 注：可以使用NC方式进行生产消费数据
 * phoneNum：手机号
 * Terminal：类型
 * province: 省（市）
 * status表示状态（1表示登录，0表示未登录）
 */

2.数据格式：

{"openid":"opEu45VAwuzCsDr6iGIf4qhnUZUI","phoneNum":"18334832972","money":"100","date":"2018-09-14T02:15:16.054Z","lat":39.688011,"log":116.066689,"province":"北京市","city":"北京市","district":"房山区","terminal":"ios","status":"0"}

3.要点：

* fastJson处理json格式的文件
* spark与kafka结合处理流数据
* 保存到redis中

4.代码：

import com.alibaba.fastjson.JSON
import com.typesafe.config.ConfigFactory
import org.apache.commons.pool2.impl.GenericObjectPoolConfig
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.spark.SparkConf
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.SparkSession
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.kafka010.{
   ConsumerStrategies, KafkaUtils, LocationStrategies}
import org.apache.spark.streaming.{
   Durations, StreamingContext}
import redis.clients.jedis.{
   Jedis<

最低0.47元/天解锁文章

黄金角

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spark题目解析

1.题目要求：/** * 1. 根据这个Json文件统计手机用户用不同系统登录的次数 * 2. 统计手机用户在各省登录的次数 * 3. 将结果保存到Redis * 注：可以使用NC方式进行生产消费数据 * phoneNum：手机号 * Terminal：类型 * province: 省（市） * status表示状态（1表示登录，0表示未登录） */2.数据格式：{"openid":"opEu45VAwuzCsDr6iGIf4qhnUZUI","phoneNum":"1833483
复制链接

扫一扫