探索日志实时展示项目

搜索日志实时展示项目[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CuPLbWYe-1639467422243)(C:\Users\yfy\AppData\Roaming\Typora\typora-user-images\image-20211213083809254.png)]项目数据写入过程:使用create_log.sh 动态生成数据 -> 导入到 hadoop01上的flume -> hadoop03上的flume -> kafka -&
摘要由CSDN通过智能技术生成

搜索日志实时展示项目

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CuPLbWYe-1639467422243)(C:\Users\yfy\AppData\Roaming\Typora\typora-user-images\image-20211213083809254.png)]

项目数据写入过程:

使用create_log.sh 动态生成数据 -> 导入到 hadoop01上的flume -> hadoop03上的flume -> kafka ->

spark(汇聚数据) -> mysql ;

项目数据读取(展示)过程:

mysql -> 服务端(一个maven项目) -> 前端(echarts可视化软件进行展示)

一、数据写入环境搭建

数据源准备

1.数据源地址 :http://www.sogou.com/labs/resource/q.php
2.数据处理

模拟数据实时动态生成效果,为后续数据处理及展示提供源源不断的数据

首先在hadoop01家目录下创建一个search目录,将老师发的数据SogouQ.reduced拷贝到目录中,以下所有操作都在search目录中进行

2.1处理乱码问题
iconv  -f  gb18030  -t  utf-8   SogouQ.reduced  >  sogou.csv
2.2创建create_log.sh文件
if [ $# -ne 3 ] ; then
 echo "usage $0   src_file  dst_file frequence"
 exit
fi
while  read line ;do echo $line | tr ' ' ',' >> $2 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值