用group by 分成多层次的循环,比在一起全量循环效率高,起码可以减少单次任务的时间
1000*1000
20*50*1000---此1000减小也可减小笛卡尔积,关键在此
大量数据多层循环的速度优化
最新推荐文章于 2022-05-24 22:54:45 发布
本文探讨了如何通过使用Python的pandas库中的groupby功能,实现多层次的数据循环操作,显著提高1000*1000规模数据处理的效率,特别关注了20*50*1000级别的任务分解,有效减少笛卡尔积,从而节省时间和资源。
摘要由CSDN通过智能技术生成