- 博客(1)
- 收藏
- 关注
原创 使用spark+python对2020年美国新冠肺炎疫情数据分析
使用spark+python对2020年美国新冠肺炎疫情数据分析一、数据集来源二、格式转换三、将文件上传至HDFS文件系统中四、使用Spark对数据进行分析五、将结果从HDFS下载至本地文件系统五、数据可视化参考材料一、数据集来源数据集来自数据网站Kaggle的美国新冠肺炎疫情数据集,(从百度网盘下载,提取码:t7tu)该数据集以数据表us-counties.csv组织二、格式转换将us-counties.csv文件放到Ubuntu系统的/usr/local/hadoop/data目录下,在这个
2021-06-14 21:49:49
3111
8
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人