Keras fit_generator中的max_queue_size, workers, use_multiprocessing设置

there2belief

于 2021-07-15 13:46:57 发布

阅读量2.6k

点赞数 5

分类专栏：掉过的坑 AI/ML/DL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dou3516/article/details/118757164

版权

AI/ML/DL 同时被 2 个专栏收录

254 篇文章

订阅专栏

98 篇文章

订阅专栏

本文详细解析了Keras fit_generator中的max_queue_size、workers和use_multiprocessing参数的作用，包括预缓存、并行效率和进程选择。通过调整这些参数，提升训练过程中的数据准备速度和GPU利用效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Keras Model.fit_generator中这三个参数的说明

max_queue_size:

maximum size of the internal training queue which is used to "precache" samples from the generator
预缓存的最大队列数量

workers:

number of threads generating batches in parallel. Batches are computed in parallel on the CPU and passed on the fly onto the GPU for neural network computations
获取batch时的“线程”并行数

use_multiprocessing:

whether to use process-based threading
是否使用基于进程的线程，猜测是选择进程并行还是线程并行

在fit_generator的demo设置中多采用max_queue_size=10, workers=1, use_multiprocessing=False

`max_queue_size`

keras训练时会持续创建batch直到缓存队列达到max_queue_size的设置或者训练结束时。使用缓存的好处是在GPU运算快时，避免GPU等待CPU生成batch而浪费时间。

`workers`

workers是CPU准备数据的并行数，和max_queue_size相似，如果GPU在等数据，调大workers和max_queue_size可以更快的准备数据，避免GPU空转。

`use_multiprocessing`

是否使用基于进程的线程，对于keras原生的数据生成器或者线程安全的数据生成器，使用True时一般不会出现问题，但是自定义的数据生成器在workers大于1时设置本参数True可能会出现阻塞的问题，例子，此时用False可以避免问题。如果使用多个生成器时，只有设置True时才能有效加速。

参考：

python - How to define max_queue_size, workers and use_multiprocessing in keras fit_generator()? - Stack Overflow

Tip – fit_generator in keras – how to parallelise correctly – Keunwoo Choi (wordpress.com)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。