Spark应用之日志数据清洗--实例解析
Spark应用之日志数据清洗一、日志数据二、准备工作三、数据清洗3.1 清洗数据 user.csv3.2 清洗数据 event.csv3.3 清洗数据 user_friends.csv一、日志数据日志数据:下载链接:events提取码: ngs3二、准备工作下载日志数据将下载的日志数据上传至 hdfs:/eventData 文件夹linux 启动spark,spark安装根目录输入:sbin/start-all.sh为了方便展示,使用Zeppelin插件,导入spark sql 相
原创
2020-09-20 23:29:02 ·
4743 阅读 ·
3 评论