此检查next_day不在mcal.get_calendar('NYSE')中。valid_days(start_date='2000-12-20', end_date='2020-01-10')非常耗时,因为它需要从7000天的数组中查找。你需要对每一个操作都这样做,所以我认为这是效率低下的主要原因。 您可以通过转换mcal.get_calendar('NYSE')来加快这种检查。valid_days(start_date='2000-12-20', end_date='2020-01-10')设置,将查找从O(N)降低到O(log N)。 但我会选择另一种策略: 编辑:允许任意数量的滞后和领先
import pandas as pd
import pandas_market_calendars as mcal
def get_next_trading_day(df1, n):
trading_days = pd.DataFrame({"date": mcal.get_calendar('NYSE').valid_days(start_date='2016-11-10', end_date='2016-12-01')})
trading_days['date'] = trading_days['date'].dt.tz_convert(None)
trading_days = trading_days[~trading_days.date.dt.weekday.isin([5,6])]
trading_days['next_trading_day'] = trading_days.date.shift(-n)