我有一个函数,它接受一个输入并返回两个值的列表
def my_func(x):
return [x+1, x+2]
说我有一个简单的数据框
df = pd.DataFrame({'x':[1,2,3,4,5]})
我想将my_func应用于列“ x”的每个值,然后将返回的值分别保存在列“ y”和列“ z”中,例如:
(df['y'], df['z']) = df.apply(lambda row: my_func(row.x), axis = 1)
显然,这是行不通的.
最好的方法是什么?
编辑:如下@Andy Hayden指出的,在这种情况下,我可以简单地使用
df['y'], df['z'] = myfunc(df.x)
这是因为myfunc在这里进行了非常简单的矢量计算.如果更复杂怎么办?
dict = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e', 6:'f'}
def my_func(x):
return [dict[x], dict[x+1]]
所以在这里,dict [x]无法再用于整个系列,我想我必须使用apply吗?然后再如何将结果放入数据框的两个单独列中
解决方法:
我认为您不需要在这里申请:
In [11]: df["y"], df["z"] = my_func(df.x)
In [12]: df
Out[12]:
x y z
0 1 2 3
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7
标签:pandas,python
来源: https://codeday.me/bug/20191118/2029451.html