也许可以通过更改获取数据的格式来简化这一过程,但下面的示例应该可以帮助您顺利完成任务。我完全跳过了zip方法,而用熊猫的方式来做这件事。为了测试,我创建了一个虚拟函数来返回一组固定产品的随机价格:import pandas as pd
def getPrice(date):
return pd.Series(np.random.randn(5), index=['apple', 'pear', 'orange', 'nanner', 'etc...'])
然后我们可以创建一个包含一些日期的pandas数据框:
^{pr2}$
这给了我们一个有3个日期的简单df:MyDate
0 2017-01-01
1 2017-01-02
2 2017-01-03
虽然遍历行比某种apply函数更不习惯,但我认为简单地迭代日期、获取价格、然后将它们放入新的dataframe并将列命名为与日期相同的列,这是非常可读和容易理解的。鉴于你的问题,我怀疑这是你想要的输出。在outputDF = pd.DataFrame() ## dump results into this df
for index, row in df.iterrows(): #iterate through every row of the date df
outputDF[row.MyDate] = getPrice(row.MyDate) #shove values into output
这给了我们一个漂亮的测向图:2017-01-01 2017-01-02 2017-01-03
apple 0.150646 0.209668 0.398204
pear 0.131142 0.046473 -0.261545
orange 0.822508 0.456384 -0.774957
nanner -0.996102 -0.260049 -0.558503
etc... 0.622459 -0.173556 -0.681957
根据您对处理日期无效情况的评论,有几种方法可以处理此问题。如果getPrice()函数在传递错误日期时抛出错误,则可以使用try/except:try:
getPrice(date)
except:
# do something else... return nulls maybe?
如果错误日期没有抛出错误,而是返回空值或空列表,那么只需在调用getPrice()之后,但在将其放入数据帧之前,检查该条件。在