数据埋点
网站或者app。在网站/app哪些页面发生某些操作时,前段的代码(网站,js;app,android/ios)通过请求(Ajax)向后端服务器发送指定格式日志数据
服务器采集日志
和离线收集差不多,采集日志,放入指定文件夹。
flume采集日志
采集日志分为两份
一份进入hdfs
一份进入kafka
实时消费
Spark Streaming开发的,可以实时的从Kafka中拉取数据,然后对实时的数据进行处理和计算,这里可以封装大量复杂的业务逻辑,甚至调用复杂的机器学习、数据挖掘、智能推荐的算法,然后实现实时的车辆调度、实时推荐。
广告流量的实时统计