我有一个包含开始日期列和结束日期列的数据框。我想通过确保开始日期早于结束日期(即开始日期<;结束日期)来检查日期的完整性。我有超过14000个观察结果要运行。在
我有以下形式的数据:Start End
0 2008-10-01 2008-10-31
1 2006-07-01 2006-12-31
2 2000-05-01 2002-12-31
3 1971-08-01 1973-12-31
4 1969-01-01 1969-12-31
我添加了一个列来写入结果,尽管我只想强调是否有不正确的列,以便删除它们:
^{pr2}$
并开始使用以下方法检查每个日期对,其中我的数据帧称为日期:for index, row in dates.iterrows():
if dates.Start[index] < dates.End[index]:
dates.Correct[index] = "correct"
elif dates.Start[index] == dates.End[index]:
dates.Correct[index] = "same"
elif dates.Start[index] > dates.End[index]:
dates.Correct[index] = "incorrect"
这是有效的,只是需要很长时间(大约15分钟)。我需要一个更高效的运行代码-有什么地方我做错了或可以改进?在