学知识蒸馏的时候,在本地跑tensorflow没有出现问题,但是都是使用CPU在跑代码而且较慢,就想着放到服务器上进行训练试试,就出现了此问题:
tensorflow.python.framework.errors_impl.NotFoundError: /home/user/anaconda3/envs/cjctf_py38/lib/python3.8/site-packages/tensorflow/core/kernels/libtfkernel_sobol_op.so: undefined symbol: _ZNK10tensorflow8OpKernel11TraceStringB5cxx11ERKNS_15OpKernelContextEb
服务器GPU配置:4个12G的2080Ti
python : 3.8.8
tensorflow : 2.7.0
用的conda创建环境
参考stackoverflow上的回答,将tensorflow/core/kernels/libtfkernel_sobol_op.so 文件删去(可以先mv移动到其他位置,保险一些)
之后就没有这个Error了
还有个其他的回答,在github的issue里面,评价挺好,不过因为需要更改tensorflow的版本,没有尝试