1、Series相关
Series类似于一个列向量,只是在其左侧加了索引,其包括values和index两个属性,Series.values和Series.index。Series对象本身以及其索引都有一个name属性,即Series.name和Series.index.name,能够对Series和其索引命名,与pandas其他功能联系紧密。
DataFrame类似于数组,只是对于行和列都有了索引。取行:frame.ix[i];取列:frame[i]或者frame.i,其中i为行或者列的索引。
2、apply方法: apply(func())是调用func()函数,例如:
func函数是无参数时:
Input: def say():
print 'say in'
apply(say)
Output: say in
func函数有参数时:
Input: def say(a, b):
print a, b
apply(say, ('hello', 'zhangsan'))
Output: hello zhangsan
在DataFrame中,如果需要对各行或者各列进行函数操作,可以利用apply函数来实现。如下例子中,apply()中默认axis是0,即将DataFrame的所有行带入函数进行操作,如果令apply(f, axis=1)意味着对所有列进行操作。
Input: frame = DataFrame(np.random.randn(4, 3), columns=list('bde'),
index=['Utah', 'Ohio', 'Texas', 'Oregon'])
f = lambda x: x.max() - x.min()
print frame
print frame.apply(f)
print frame.apply(f, axis=1)
Output: b d e
Utah -0.613367 -0.689123 0.001532
Ohio 0.835977 1.377497 -0.681188
Texas -1.865279 -0.587092 0.057747
Oregon -0.770581 1.244155 0.060371 #frame
b 2.701256
d 2.066620
e 0.741559
dtype: float64 #frame.apply(f)
Utah 1.753016
Ohio 2.443354
Texas 0.760543
Oregon 2.246665
dtype: float64 #frame.apply(f, axis=1)
3、排序
对于Series而言,使用sort_index()和sort_value()来实现对于行(索引)和列(值)的排序,其返回的是一个新对象。
Input: obj = Series([4,