离线数仓分析 第一步、获取数据源 (1)安装nginx (2)上传shop.html文件到/var/www/html目录 (3)在浏览器通过192.168.1.11(自己的id)/shop.html访问网页产生日志 (4)监控nginx生成的访问日志:sudo tail -F /var/log/nginx/access.log 第二步、Flume采集日志到HDFS 准备工作: 1、开启三台虚拟机 2、开启三个节点的zookeeper的服务 3、在master开启hadoop和yarn