因工作原因,开始学习数据分析,挖掘等的相关内容。目前正在利用空闲时间学习,此文为《利用python进行数据分析》的读书笔记,以及相关的注意点,写文以做留存提醒之用。目前使用的电脑是windows7+64位
准备工作篇:
该章节主要介绍的是相关环境的安装和设置,由于书籍作者写的时间问题,很多的工具都是老版本,可能已经改名或者更新版本,完全参照书实现存在困难。
本书使用的环境是一个python的集成开发环境-Enthought Python Distribution(EPD),以及一些面向科学计算的库,以实现数据分析,本节主要介绍的是EPD和pandas库的安装和设置。
1 Enthought Python Distribution(EPD)
书中介绍的EPD是一个python的集成开发环境,由Enthought公司开发,现在这个已经改名叫做Enthought Canopy。其集成了NumPy,SciPy,matplotlib及Ipython等十分常用的包。有个人版本,公司版本,和学术版本。个人版本中根据需求不同,价格不同,个人版本中提供免费版本,上述包在免费版本中都存在。学术版本貌似只要提供一个学校邮箱地址就可以,没试过,直接下的是个人免费版,学习阶段应该够用。免费的下载地址是:https://store.enthought.com/downloads/#default
另外,这本书中介绍,EPD在windows下只有32位系统,本人亲测证明,已经有64位的了,下载的时候它会自动根据windows的系统下载对应版本。
下载完成之后点击安装即可,安装的版本是python2.7 。