【手机流量分析项目】

手机流量分析项目

项目流程

  1. 通过数据源文件,首先求出每个手机号的总上行流量、下行流量、总流量。
  2. 根据上一步中的流量汇总结果再按照不同的手机号进行分组输出到不同的文件中。

数据格式

  • 第二个字段:手机号
  • 倒数第三个字段:上行流量
  • 倒数第二个字段:下行流量

准备数据源

将数据文件传入Linux系统中,并将文件上传至HDFS中的指定目录(这里在hdfs的根目录下创建一个文件夹input)中。

创建java项目编写MapReduce程序

1)创建maven项目,并设置相关依赖;
2)编写代码。包括FlowBean类(存放手机号、上行流量、下行流量),FlowMapper类(实现map过程)、FlowReducer类(实现reduce过程)、ProvincePartitioner类(对reduce之后的数据进行分区)以及FlowDriver类(主类方法);
3)对MapReduce程序进行打包,并上传至Linux系统。

运行jar包

启动hadoop集群之后,使用./bin/hadoop jar ./myapp/PhoneLogAnalyse.jar /input /output运行jar包。

结果展示

output文件夹:

在这里插入图片描述
输出结果1:
在这里插入图片描述
输出结果2:
在这里插入图片描述
输出结果3:
在这里插入图片描述

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值