Series是一种类似一维数组的数据结构,由一组数据和与之相关的index组成,这个结构一看似乎与dict字典差不多,我们知道字典是一种无序的数据结构,而pandas中的Series的数据结构不一样,它相当于定长有序的字典,并且它的index和value之间是独立的,两者的索引还是有区别的,Series的index是可变的,而dict字典的key值是不可变的。
如何创建Series?
import numpy as np
import pandas as pd
a = np.random.randint(1,10,size=12).reshape(3,4)
#python list创建Series
s1 = pd.Series([1,2,3,4])
print (s1)
print (s1.values) #查看数据
print (s1.index) #查看index
#numpy array 创建Series
s2 = pd.Series(np.arange(10))
print(s2)
#python字典创建
s3 = pd.Series({'1':1,'2':2})
print (s3)
print (s3.values)
print (s3.index)
0 1
1 2
2 3
3 4
dtype: int64
[1 2 3 4]
RangeIndex(start=0, stop=4, step=1)
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
dtype: int64
1 1
2 2
dtype: int64
[1 2]
Index(['1', '2'], dtype='object')
s4 = pd.Series([1,2,3,4],index=['a','b','c','d'])
print(s4)
print(s4.values)
print(s4.index)
a 1
b 2
c 3
d 4
dtype: int64
[1 2 3 4]
Index(['a', 'b', 'c', 'd'], dtype='object')