错误及应对方案
1,问题:训练正常,预测和评估的时候报OOM:
- 办法:减少预测和训练的batchsize,或者减少网络参数。参考:ResourceExhaustedError (see above for traceback): OOM when allocating tensor of shape [7744,512] #3393
2,问题:从dataset打印数据,报错OP_REQUIRES failed at example_parsing_ops.cc:144 : Invalid argument: Name: , Feature: label (data type: int64) is required but could not be found.
- 原因:dataset解析问题,生成的.tfrecord数据中的key(键值)和你在代码中读取的 key 不匹配导致的。
- 办法:检查dataset解析的feature_spec,保证正确。