flask单个请求中计算密集型的优化过程

最新推荐文章于 2024-05-08 23:17:53 发布

rgc_520_zyl

最新推荐文章于 2024-05-08 23:17:53 发布

阅读量406

点赞数

分类专栏：高性能 python 文章标签： python numba joblib

本文链接：https://blog.csdn.net/rgc_520_zyl/article/details/112294671

版权

38 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

被请求接口中的情况如下: 根据用户输入参数, 需要使用pandas和numpy进行大量计算,这些计算中 ,比如在范围 1-100之间使用随机函数生成一个随机值,这个随机值就是一条线上的点; 这个接口需要随机100万次然后把100万个点渲染到前端页面上;

分析需求: 因为是随机100万次,每次随机值都放在list中,最后发给前端; 每次计算时不会影响其他程序;

优化思路:

可以考虑把100万次的计算平均放到 10个进程中;每个进程负责10万次计算; 这样可以缩减10倍时间; 不应该放到线程中,因为此接口瓶颈是计算密集型任务,放在线程中由于GIL锁的原因和线程间的来回切换更慢; 如果是 IO密集型任务(提取db数据等等)可以考虑多线程; 技术为:使用多进程的第三方包: joblib;

优化结果: 速度确实快了10倍,但是每个进程还是要for循环10万次, 继续优化;

优化思路:

思路一:多进程用过了,每个进程中如果使用多线程因为是计算密集型所以多线程没用; 怎么办,从代码运行速度上考虑, 如何让numpy跑的更快, 最后发现使用技术为: numba ,此包第一次运行代码时先编译一次,后续运行不再编译,能提升100倍;
思路二:用了10个进程,每个进程有点大,可以把机器的所有进程都用到,但是每个进程循环的次数还是很多, 能不能在不换机器的情况下增加并发数; 于是找到了阿里云的函数式计算服务, 可以把计算请求发送到阿里云服务,对方用一个机器的一个进程跑一个随机点的for循环计算函数; 这样可以最大化的增加并发数,可以做到每个计算函数只跑合理次数的for循环; 但是阿里云此服务的缺点在于网络波动较大,以及目前2-3分钟如果不使用阿里云分配的资源会进行回收,这时会出现冷启动耗时较长; 且资金耗费较高;

决定使用第一种思路的 numba进行优化; 结果确实在 2s内完成接口请求;

关注