背景:
最近遇到了一个较为头痛的问题,连续改BUG两天最终才解决掉,解决此问题流程及方法如下:
此问题是在tf-gpu=2.3、cuda=10.1、cudnn=7.4.2环境下出现在(tf的cpu版本时,是可以跑通模型的)。
具体BUG情况如下:
1、failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED
2、Blas GEMM launch failed :
tensorflow.python.framework.errors_impl.InternalError: Blas GEMM launch failed : a.shape=(2048, 2), b.shape=(2, 768), m=2048, n=768, k=2
[[{ {nodeStatefulPartitionedCall/StatefulPartitionedCall/transformer_encoder/StatefulPartitionedCall/type_embeddings/MatMul}}]] [Op:__forward_restored_function_body_32773]
Function call stack:
restored_function_body
以下办法总有适合你的一个:
1.