大数据实战电信客服

最新推荐文章于 2023-06-12 00:02:22 发布

独创之上

最新推荐文章于 2023-06-12 00:02:22 发布

阅读量486

点赞数

分类专栏：大数据项目文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a18379692263/article/details/129296888

版权

大数据项目专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本项目主要步骤：项目需求分析、环境准备、具体项目实现

一、项目需求分析

主要工作是将生产出来的数据通过flume进行采集，然后使用kafka的消息队列实时传输移动数据保存到HBase中，最后通过MapReduce操作将整体数据显示到前端页面

二、环境准备

1、启动zookeeper集群：zk.sh start

2、启动kafka集群：kf.sh start

3、启动hadoop集群：myhadoop.sh start

4、启动Hbase：bin/start-hbase.sh

二、项目实现

1、准备数据

首先准备初始的移动通话数据用于生成电信call.log：

编写代码生产数据（部分代码如下：）

主任务（通过传入两个数据地址参数，保存数据）：

（1）、首先从本地地址读取数据，转换数据类型，然后根据要划分数据的类型（主叫，被叫，通话时间、通话时长）进行设置

（2）将数据刷洗到文件中

生成的通话日志如下：主要包括主叫、被叫、通话时间、通话时长

最后将代码打包成jar包在linux中运行（通过xftp进行传输）

java -jar ct-producer.jar /opt/module/data/contact.log /opt/module/data/call.log

2、采集数据、消费数据

编写flume采集然后kafka进行队列传输进行消费，flume-2-kafka.conf

在kafka进行消费之前要配置kafka的主题：

可以将消费的数据打印到控制台

3、HBase保存数据

在kafka消费数据的同时，将数据依次插入到HBASE中，而之前到对HBase进行配置，创建命名空间和表，设置rowkey、列族等信息。

插入数据到不同的分区，避免数据倾斜。

可在HBase官网提供的工具中查看：http://hadoop102:16010/

查看分区划分

在linux中查看具体数据分区

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
大数据实战电信客服

电信客服项目
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

独创之上 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。