第1关:大数据文件分块读取技术、二分法查找
任务描述
本关任务:采用分块读取的方式,读取“159站点8月份刷卡数据.csv”数据表,每次读取10000条记录,其中数据表有两个字段,依次为:刷卡类型(21-表示进站,22-表示出站);刷卡时间,精确到毫秒,示例如:“2015-08-01-22.50.02.000000”
任务如下:
1.采用二分法,获得1-30日(最后一天除外)每天最后一条刷卡记录的刷卡时间,以及对应的index值(即数据框中的行标号),用一个元组来表示r,最后1-30日每天的r,则用一个嵌套列表r_d来表示
2.返回r_d,即每天最后一条刷卡记录的刷卡时间和对应的行记录标号,方便后续快速统计计算。
#******