import numpy as np
from pandas import Series,DataFrame
import pandas as pd
frame=DataFrame(np.random.randn(4,3),columns=list('abc'),index=[list('zxcv')])
frame
Out[7]:
a b c
z -0.291453 -1.926233 0.304532
x 0.973663 0.508755 -0.015359
c 2.001680 -0.287146 -1.017125
v -2.117478 -1.641734 2.654039
np.abs(frame)
Out[8]:
a b c
z 0.291453 1.926233 0.304532
x 0.973663 0.508755 0.015359
c 2.001680 0.287146 1.017125
v 2.117478 1.641734 2.654039
将函数应用到由各行或者各列所形成的一组数组上。DataFrame的apply方法即可实现此功能。
f = lambda x: x.max() - x.min()
frame.apply(f)#axis默认=0,别的不是很理解
Out[10]:
a 4.119158
b 2.434987
c 3.671164
dtype: float64
frame.apply(f,axis=1)
Out[11]:
z 2.230764
x 0.989022
c 3.018805
v 4.771516
dtype: float64
除了标量值外,传递给apply的函数还可以返回由对各值组成的Series
def f1(x):
return Series([x.min(),x.max()],index=['min','max'])
frame.apply(f1)
Out[14]:
a b c
min -2.117478 -1.926233 -1.017125
max 2.001680 0.508755 2.654039
frame.apply(f1,axis=1)
Out[15]:
min max
z -1.926233 0.304532
x -0.015359 0.973663
c -1.017125 2.001680
v -2.117478 2.654039
格式化字符串,使用applymap
format = lambda x: '%.2f' % x
frame.applymap(format)
Out[17]:
a b c
z -0.29 -1.93 0.30
x 0.97 0.51 -0.02
c 2.00 -0.29 -1.02
v -2.12 -1.64 2.65
之所以叫applymap,是因为Series有一个应用于元素级函数的map方法
frame['b'].map(format)
Out[19]:
z -1.93
x 0.51
c -0.29
v -1.64
Name: b, dtype: objec