用户行为日志分析:Nginx,Ajax
日志数据内容:
1,访问的系统属性:操作系统,浏览器等等
2.点击的url,从哪个url跳转过来,页面停留时间
3.访问信息:session_id,访问ip等
日志分析的意义:
1.网站的眼睛
2.网站的神经
3.网站的大脑
离线数据处理:
1.数据采集
Flume:将web日志写到HDFS
2.数据清洗:
脏数据:Spark,Hive,MapReduce
清洗完数据可以放在HDFS上
3.数据处理
按照我们的需求进行相应业务统计和分析
4.处理结果入库
结果存放在RDBMS,NoSQl
6.数据可视化展示
功能实现:
1.数据实现
2.数据可视化:一副图片最伟大的价值莫过于它能够使得我们实际看到的比我们期望看到的内容更加丰富
数据可视化常用框架:HUE
Zeppelin
echarts
highcharts
D3.js