接着回答昨天的问题
有两个series,如下所示:
>>> import pandas as pd
>>> import numpy as np
>>> df1 = pd.DataFrame({'y1':[1, 2, 3, 4]})
>>> df2 = pd.DataFrame({'y2':[3, 1, 2, 6]})
希望通过比较y1, y2使得y2中保存的是y1, y2中较小的值。
即预期结果是这样的
{‘y2’: 1, 1, 2, 4}
解法三:直接调用loc方法
>>> df2.loc[df2['y2'] > df1['y1'], 'y2'] = df1['y1']
>>> df2
y2
0 1
1 1
2 2
3 4
解法四:调用pandas中的where方法
# pandas中的where方法和numpy是不同的。
# 第一个参数返回结果如果为true,则保留原值,
# 如果为false则会使用第二个参数的值替代
>>> df2['y2'] = df2['y2'].where(df2['y2'].lt(df1['y1']), df1['y1'])
>>> df2
y2
0 1
1 1
2 2
3 4
解法五:使用mask方法
# mask方法与where方法使用起来是一样的
# 但是mask是当第一个参数为true时,使用第二个参数替代
# 当为false时,使用原值
>>> df2['y2'] = df2['y2'].mask(df2['y2'].gt(df1['y1']), df1['y1'])
>>> df2
y2
0 1
1 1
2 2
3 4
哈哈,以上就是python小工具今天的介绍,有兴趣欢迎关注python小工具,一起学习Python和pandas