Pandas 数据分析-第一章(Pandas入门)
如果要学习pandas numpy之前请先在了解一下python,并学习相关基础主要是基础语法和内置的数据结构(列表,字典,元祖,等)python非常简单易学。相信不会花费你很多时间本文以及后续章节使用的均是python3版本,在此我建议使用IPython或Jupyter notebook也是十分方便安装网上一大堆,我就不浪费大家时间了。
其实说是Pandas教程不如说是numpy,pandas,matplotlib的教程合集。大多数情况下numpy和pandas是分不开的,你做好了数据又必然使用matplotlib来做数据可视化。emm…是不是发现要学的东西越来越多呢?哈哈没必要担心,这些东西非常简单,只要努力学没什么不行的,几年前买了一本《利用pandas进行数据分析》自学,这系列的教程也是按照这本书的套路来,并且着重讲一些我工作中用到的比较多的函数或方法。下面正式开始介绍pandas的数据结构
Series
Series是一种类似于一维数组的对线,它由一组数据(各种Numpy数据类型)以及与之相关的索引组成,举一个简单的例子来看一下
In [1]: import numpy as np
In [2]: import pandas as pd
In [4]: obj = pd.Series([1,2,3,4])
Out[5]:
0 1
1 2
2 3
3 4
dtype: int64
这里我们创建了一个名称为obj的Series对象,