最近使用python对一些数据进行处理,大概涉及几十万个数据,两台电脑跑了1天1夜才处理完所有的数据,在实现任务的过程中,深知自己的痛点和不足,现在任务已经完成,准备下手对多线程相关进行透彻研究
程序加速的方式:
- 多线程并发
- 多CPU并行
- 多机器并行
涉及技术与库:
- threading
- multiprocessing
- hadoop/hive/spark
最近使用python对一些数据进行处理,大概涉及几十万个数据,两台电脑跑了1天1夜才处理完所有的数据,在实现任务的过程中,深知自己的痛点和不足,现在任务已经完成,准备下手对多线程相关进行透彻研究
程序加速的方式:
涉及技术与库: