大数据的开源工具

 

 

8个指标:

 

AvgDeep 平均访问深度,深度值越高越好

  1. 海量数据存储问题 Hadoop.HDFS,S3亚马逊
  2. 海量数据收集加工(清洗) flume+log4j
  3. 分析平台:
    1. 离线分析平台 Hadoop.MapReduce(基于破网络破机器,基于文件)
    2. 实时分析平台 Spark(内存,机器学习,吞吐量大)/Storm(流,速度最快)
  4. 从看似无用的海量数据中提炼出有价值数据(数据挖掘)机器学习
  5. 两条线:

  6. 离线分析
  7. Log4j -> flume -> Hadoop.HDFS -> Hive -> Mysql(结果数据量小)/ HDFS /Hbase

  8. 实时分析
  9. Log4j -> flume -> kafka -> storm -> Mysql/HDFS/kafka/es

  10. Storm流式处理数据平台

  11. 流式,数据是永不停止(对多余数据扔掉)
  12. 流式数据,波峰波谷,消峰平谷Kafka(队列)
  13. PV (page view)点击率,点击率越高越高
  14. UV(unique view)独立访客,不同浏览器产生不同uv
  15. VV(visit view)访客访问的次数
  16. BR(break/bounce rate)跳出率,用户对网页黏着度。瑕疵(最后一个页面不统计)
  17. NewIP 每日新增的IP地址
  18. NewCust 每日新增的用户
  19. AvgTime 平均访问时间,时间越长越好
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值