Python与数据分析(一)------Python简介与安装
一、为什么是Python
目前,Python语言的使用相当广泛,从国外的Google、YouTube、Mozilla到国内的豆瓣、腾讯、网易等等,都在使用Python作为开发语言。根据TIBOE 2016年编程软件排行,Python位列第五,而从长期走势来看,Python一直处于上升趋势(如图1所示)。为什么Python如此受欢迎,让我们先来看看Python的前世今生。
图1 TIBOE 1986-2016年TOP10 编程语言排行
Python的作者是吉多.范.罗苏姆,荷兰人,1995年移居美国。荷兰阿姆斯特丹大学硕士学位,曾任职于谷歌公司。1989年,为了打发圣诞节假期,罗苏姆开始编写Python语言的编译/解释器。Python(英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/)具有功能全面、易学易用、可拓展等特性。1991年,第一个Python编译/解释器诞生。它是用C语言实现的,能够调用C语言生成的动态链接库。Python语法简单,同时提供了丰富的模块,非常适合作为编程的入门语言。下面我们来开始Python学习之旅,首先看看在各种平台上如何安装Python。
二、Python的安装
我个人认为,Python的安装可以从三个角度来区分,分别是Python命令行、IDE工具和IPython Notebook(现在称作Jupyter Notebook),同时Python版本也分为2.7版本和3.x版本。对于选择哪个版本安装,个人认为还是选择最新版本,因为Python模块将会陆续迁移到新版本。
1、Python交互式命令行
登录Python官网,https://www.python.org/,根据自己的操作系统下载相应的安装包,在这里我要简单介绍下各个安装版本的区别,以windows为例(如图2所示),
图2 Python官网windows安装界面截图
可以看到,有web-based installer、executable installer、embeddable zip等版本,其中web-based installer指通过网络下载,文件小但需要网络环境;executable installer指下载安装文件,下载并安装后才能使用;embeddable zip指Python的zip压缩版,下载后无需安装,可以直接使用。x86指32位操作系统,x86-64指64位操作系统。这里需要注意的是,在安装过程中要勾选Add python.exe to path选项,这样就可以在命令行环境下直接使用。以windows为例,安装后如图3所示。
图3 Python运行截图
2、Python的IDE工具
IDE全称是集成开发环境 (Integrated Development Environment),交互式命令行的Python工具适用于简单的Python语法学系,优点是输入语句可直接得到结果,便于初学者掌握Python语言。缺点是语法没有高亮显示,没有强制缩进,也不能作为软件交付的开发平台。因此,Python的集成开发环境对于软件开发者来说也是非常重要的。这里简要介绍几款比较好用的IDE工具。
2.1 Pycharm
Pycharm可以提高Python语言开发效率,支持调试、语法高亮、智能提示、自动完成、强制缩进等等。 Pycharm的官方网址是: http://www.jetbrains.com/pycharm/。分为专业版和社区版,专业版是需要付费的,社区版免费。那么这两个版本有什么区别呢,让我们看看官网上的介绍(如图4所示)
图4 Pycharm专业版和社区版的区别
从中我们看到专业版与社区版的主要区别在于,专业版提供的支持更多,主要是在网络和数据库编程方面。 Pycharm运行后如图5所示。
图5 Pycharm运行后的截图
2.2 Spyder
Spyder和其他的Python开发环境相比,最大的优点是模仿MATLAB的“工作空间功能”,可以让程序员很方便的观察和修改数组的值。比较简便的下载Spyder的方法是以windows为例,通过下载以下任一种软件,其中自带了Spyder。1、Anaconda,2、WinPython,3、Python(x,y)。这里以GitHub上的一张图,展示Spyder运行后的效果。
图6 Spyder 界面截图
3、Ipython Notebook(Jupyter Notebook)
Ipython notebook 目前已成为Python数据分析的一个重要工具,使用浏览器作为界面,向后台的IPython服务器发送请求,并显示结果。在浏览器的界面中使用单元(Cell)保存各种信息。每个代码单元都有一个输出区域,在Code单元中输入代码,按 Shift-Enter 将运行此代码,代码中最后一个表达式的值将在输出区域显示。建议通过下载Anaconda以获得IPython notebook,这样做的好处是几乎是一键下载,省去了关于版本兼容的问题。 我们 可以通过官网下载最新版本的Anaconda,官网地址是 https://anaconda.org/。下载后,我们在开始菜单输入cmd命令,找到Anaconda安装目录,在Scripts文件下输入 jupyter-notebook.exe,就会在浏览器打开jupyter界面(如图7所示)。
图7 运行jupyter-notebook