Python 语言在近年来最火的一门编程语言,2017 年荣膺“2017年度编程语言”,以其较高的增长率超越老牌语言 C、Java、C++。2019 年 TOIBE 年度编程语言排行榜中 Python 以 +1.4% 的增长率稳居第三位,就在前不久 IEEE Spectrum 发布了 2020 年编程语言排行榜,Python 超越 C语言与 Java 处于冠军宝座位置。Python 语言自 1991 年问世以来,成为当下最流行的解释语言之一。
由于 Python 语言的简洁性、易读性以及可扩展性,在国外用 Python 做科学计算的研究机构日益增多,一些知名大学已经采用 Python 来教授程序设计课程;在国内 Python 语言被纳入初高中以及大学教材。
Python 之所以能经久不衰且有愈演愈烈的态势,和当前发展迅猛的人工智能以及数据分析有不可分割的原因,Python 强大的科学计算扩展库,被广大程序设计师以及企业所认同。例如常用 3 个经典的科学计算库:NumPy、SciPy 和 matplotlib,它们分别为 Python 提供了快速数组处理、数值运算以及绘图功能。
综上所述,Python 语言及其众多的扩展库所构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表等。下面我们就详细讲一下为什么选择 Python 做数据分析以及它的优缺点。
1. Python数据分析的理由
对于数据分析师从业者而言,经常需要从事:数据库操作、报告撰写、数据可视化、数据挖掘的工作。这些工作不写代码也可以操作,利用 Excel 进行数据可视化、使用 SPSS 等一些亲民类平台工具进行数据挖掘,在《数据分析是什么?》中我们介绍了使用平台工具虽然可造作性强,但是不可避免的会存在重复机械的劳动,