Pandas(Python Data Analysis Library)是基于NumPy的数据分析模块,它提供了大量标准数据模型和高效操作大型数据集所需的工具,可以说Pandas是使Python成为高效且强大的数据分析环境的重要因素之一。
通常来说,我们使用: import pandas as pd
Pandas中有三种数据结构:Series、DataFrame和Panel。Series类似于数组,DataFrame类似于表格,Panel则可以视为Excel的多表单Sheet。
1、Series
Series是一种一维数组对象,包含了一个值序列,并且包含了数据标签,称为索引(index),通过索引访问数组中的数据。可以通过列表、字典创建。
import pandas as pd
ob1 = pd.Series([1,-2,3,-4])
print(ob1)
i = ['a','c','d','b']
v = [5,4,3,2]
ob2 = pd.Series(v, index = i, name = 'col')
print(ob2)
sdata = {'leizi':1000,'tinger':1500,'wei':3000}
ob3 = pd.Series(sdata)
print(ob3)
***********************************************
0 1
1 -2
2 3
3 -4
dtype: int64
a 5
c 4
d 3
b 2
Name: col, dtype