现代社会,数据量在急剧的增加,生活处处都充满着数据,购物、交通、就医....
因此,无论你是从事金融、互联网、人事、财务等不同的工作岗位,都会和经常和各种数据打交道。
通过数据,能够挖掘出更深、更有价值的信息,而不是浮于表面。
本文就来给大家介绍14个非常值得关注的数据科学项目,它们主要可以分为如下3类:
-
可视化项目
-
探索性数据分析(EDA)项目
-
预测建模
下面,就开始本文的介绍。
可视化项目
在上述列出的3类项目中,或许最为简单的就是数据可视化项目。
以Python为例,目前有很多知名、好用的数据可视化工具包,通过这些工具包可以很容易实现数据的可视化。
以下是三个有趣的数据集,可以用于练习你的数据可视化能力。
冠状病毒可视化
难度:容易
数据集链接[1]
了解如何使用Plotly构建动态可视化,以展示冠状病毒如何像上述之一那样在全球范围内传播!Plotly是一个了不起的库,它使数据可视化变得动态,有吸引力且简单。
澳大利亚野火可视化
难度:容易
数据集链接[2]
2019-2020年的丛林大火季节,也称为黑色夏天,由2019年6月开始的几场极端野火组成。
据维基百科称,大火烧毁了约1,860万公顷,烧毁了5,900多座建筑物。
这是一个有趣的项目, 利用Plotly或Matplotlib利用数据可视化技能来显示野火的规模和地理影响。
地表温度可视化
难度:容易-中等
数据集链接[3]