数值运算即:对pandas里的数据进行加减乘除运算和高级函数运算。
当使用sub、add等通用函数运算时,panda的索引(index)有两个特点:(1)保留索引和列标签
(2) 索引自动对齐
特点1:索引的保留`
我们通过一个series列子演示:
rng=np.random.RandomState(42)
ser = pd.Series(rng.randint(0,10,4))
0 6
1 3
2 7
3 4
dtype: int32
#进行exp(以e为底的log运算),索引和原来没有变化
print(np.exp(ser))
0 403.428793
1 20.085537
2 1096.633158
3 54.598150
dtype: float64
通过一个dataframe列子演示:
其行索引和列标签和原来一样
df=pd.DataFrame(rng.randint(0,10,[3,4]),columns=['a','b','c','d'])
print(np.sin(df*np.pi/4))
a b c d
0 -1.000000 7.071068e-01 1.000000 -1.000000e+00
1 -0.707107 1.224647e-16 0.707107 -7.071068e-01
2 -0.707107 1.000000e+00 -0.707107 1.224647e-16
第二特点:索引会自动对齐,结果是两个Series或datafrma的并集
a=pd.Series([2,4,6],index=[0,1,2])
b=pd.Series([1,3,5],index=[1,2,3])
0 2
1 4
2 6
dtype: int64
1 1
2 3
3 5
dtype: int64
a+b,索引时 a和b索引的并集
#缺失值会用NAN填充
print(a.add(b))
0 NaN
1 5.0
2 9.0
3 NaN
datatfram与series之间的运算
df=pd.DataFrame(rng.randint(10,size=(3,4)),columns=list('qrst'))
q r s t
0 1 7 5 1
1 4 0 9 5
2 8 0 9 2
s1=df.iloc[0,:2]
q 1
r 7
df的qr俩列每一行都减去了s1,st两列由于没有索引相匹配,显示空值。(结果是dataframe和series的交集)
df-s1
q r s t
0 0.0 0.0 NaN NaN
1 3.0 -7.0 NaN NaN
2 7.0 -7.0 NaN NaN
‘’‘运算方法’’’
# pyhon运算符 方法
# + add()
# - sub()、subtract()
# * mul()、multiply()
# / div()、divide()、truediv
# // floordiv()
# % mod()
# ** pow()