pandas通常和numpy一起学习,抽时间我会把numpy部分也更新上来。初学者建议按照上面的编号来学习,这样以来知识点会比较全面,不需要你每个都掌握,只要你每个都是用过,都有一些印象,使用的时候再过来查看就行了,这才是学习,一定要掌握学习方法。
pandas是python里对数据进行处理和分析比较流行的模块,涉及一些统计学的知识,可以自行学习,除此以外和python的其他模块的学习没啥区别,比较简单。 pandas有三种数据结构series、dataframe和panel。 Series类似于数组,dataframe则是类似表格,而panel则可以视为excel的多表单sheet。
1. Pandas的安装与使用
Pandas是 Python里比较优秀的内存基的类SQL的数据科学工具,用Cython编写,运行速度较快!
1.1 pandas环境的安装
在ubuntu系统下安装。
$ sudo apt-get install python-pandas
学习pandas,还需安装numpy、scipy、matplotlib等,之前的学习内容已经安装过这些软件,可以自行查找安装这些模块。
$ sudo apt-get install build-essential python-all-dev
学习pandas的一些基本概念可以用ipython软件,可以从一些网站下载,windows版下载,选择py2的是python2.7的。
1.2 pandas环境的使用
pandas的学习环境是否完备,可以通过下面的方式进行简单的检验一下。
$ python
>>> import pandas
>>> pandas.__version__