我有个有趣的问题:
file1.csv有几百行,如:Code,DTime
1,2010-12-26 17:01
2,2010-12-26 17:07
2,2010-12-26 17:15
file2.csv大约有1100万行,如:id,D,Sym,DateTime,Bid,Ask
1375022797,D,USD,2010-12-26 17:00:15,1.311400,1.311700
1375022965,D,USD,2010-12-26 17:00:56,1.311200,1.311500
1375022984,D,USD,2010-12-26 17:00:56,1.311300,1.311600
1375023013,D,USD,2010-12-26 17:01:01,1.311200,1.311500
1375023039,D,USD,2010-12-26 17:01:02,1.311100,1.311400
1375023055,D,USD,2010-12-26 17:01:03,1.311200,1.311500
1375023063,D,USD,2010-12-26 17:01:03,1.311300,1.311600
我要做的是编写一个脚本,获取file1.csv中的每个DTime值,并在file2.csv的DateTime列中找到部分匹配的第一个实例,然后输出DateTime、Bid和Ask。部分匹配在前16个字符上。
两个文件都是从最旧到最新排序的,因此如果file1.csv中的“2010-12-26 17:01”与file2.csv中的4个条目匹配,我只需要提取第一个:“2010-12-26 17:01:01”
不知道如何继续。。我试过一本字典,但值的顺序很重要,所以我不确定那是否可行。也许可以将file1的DTime列带到一个列表中,并为该列表中的每个条目在file2中搜索DateTime?
谢谢你们