在做OCR模型训练,感觉迭代速度有些慢,因此想要分析一下具体的GPU使用占比。
1. 在训练脚本中增加timeline工具,并记录推理时间
OCR的模型搭建使用的是Keras,因此不同于传统的Tensorflow 方式,需要在 model.compile()中增加profile相关配置,该阶段的操作参考了[1] 这篇文章。
- 代码部分:
# step 1: 定义 run_options 和 run_metadata, 用于保存op的属性
run_options = tf.RunOptions(trace_level=tf.RunOptions.FULL_TRACE)
run_metadata = tf.RunMetadata()
……
# step 2: 将 run_options 和 run_metadata 添加至 model的 compile方法
model.compile(
……