import pandas as pd
pandas中的Series
Series是一种一维的数组型对象,它包含了一个值序列,并且包含了数据标签,称为索引(index)
Series往往用来处理表格数据的一行或者一列。
my_series = pd.Series([1,2,3,4])
0 1
1 2
2 3
3 4
dtype: int64
左边为索引,右边为值。索引是默认生成的,从0到N-1,N是Series的长度。
可以通过values和index属性分别获得Series对象的值和索引。
print(my_series.index)
print(myseies.values)
RangeIndex(start=0, stop=4, step=1)
[1 2 3 4]
也可以自己指定索引,通过给index参数赋值来实现
series_2 = pd.Series([1,2,3,4],index=['一','二','三','四'])
一 1
二 2
三 3
四 4
dtype: int64
还可以由Python的字典来创建Series
my_dict = {
'name': 'Elric',
'age': '22',
'sex': 'man'
}
s3 = pd.Series(my_dict)
name Elric
age 22
sex man
dtype: object
访问Series中的数据
print(s3[0])
print(s3['age'])
print(s3[['name','age']])
Elric
22
name Elric
age 22
dtype: object
索引与切片的操作与NumPy类似
print(s3[0:2],'\n')
print(s3['name':'age'])
name Elric
age 22
dtype: object
name Elric
age 22
sex man
dtype: object
Series中的函数或NumPy风格的操作,比如布尔值数组进行过滤,与标量相乘,或是应用数学函数,都适用于Series对象
print(s3[s3=='22'])
print(series_2[series_2>1])
print(series_2 * 3)
age 22
dtype: object
二 2
三 3
四 4
dtype: int64
一 3
二 6
三 9
四 12
series可传递给numpy处理
import numpy as np
# square平方
s4 = np.square(series_2)
print(s4)
一 1
二 4
三 9
四 16
dtype: int64