- 博客(1)
- 收藏
- 关注
原创 2020年美国新冠肺炎疫情数据分析
2020年美国新冠肺炎疫情数据分析一、实验环境二、数据集1.数据集介绍2.格式转换3.将文件上传至HDFS文件系统中三、使用Spark对数据进行分析1.完整代码2.读取文件生成DataFrame3.进行数据分析4.结果文件四、数据可视化1.可视化工具选择与代码2.结果图表展示五、参考资料 本案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言,使用Spark对数据进行分析,并对分析结果进行可视化。 一、实验环境 (1)Linux: Ubuntu 16.04 (2)Hadoop3.1.3
2021-06-11 17:23:54 477 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人