之前研究了一下pandas索引查询的速度
1.使用query,速度最慢
2.把要查询的键用set_index设为index后再用loc切片查询会加快速度,根据StackOverflow上面的回答,pandas内部会对index做优化。
3.groupby把索引hash到一个字典,遍历循环这个字典。
尽管有很多小技巧可以提升速度,总体上pandas的速度比data.table还是要慢
之前研究了一下pandas索引查询的速度
1.使用query,速度最慢
2.把要查询的键用set_index设为index后再用loc切片查询会加快速度,根据StackOverflow上面的回答,pandas内部会对index做优化。
3.groupby把索引hash到一个字典,遍历循环这个字典。
尽管有很多小技巧可以提升速度,总体上pandas的速度比data.table还是要慢