- 博客(7)
- 资源 (3)
- 收藏
- 关注
原创 解决Docker + Tensorflow serving启动服务时占用所有GPU
Docker + Tensorflow serving启动服务 官网命令如下docker run -p 8503:8501 -t $USER/resnet_serving 后会将所有占用剩余的GPU ,但实际只需使用一个 启动命令中加入红色部分docker run -p 8503:8501 --name tfserving-resnet -e NVIDIA_VISIBL...
2019-05-29 16:33:53 2422
原创 解决 ImportError: libcublas.so.10.0:
升级到cuda10 环境 1.在jupyter terminal 中 进入python import tensorflow as tf 没问题 ,在ipython中执行报ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory查看 对应的/usr/lo...
2019-05-22 15:36:17 5000
原创 Gpu 服务器相关驱动安装链接
NVIDIA驱动与 CUDATable 1. CUDA Toolkit and Compatible Driver Versions CUDA Toolkit Linux x86_64 Driver Version Windows x86_64 Driver Version CUDA 10.1.105 >= 418.39 >= 418.96 CUD...
2019-05-22 10:25:51 824
原创 容器内使用sudo 报bash: sudo: command not found
容器内避免使用roo,建立新用户执行命令 使用sudo ,提示如下bash: sudo: command not found解决办法apt-get updateapt-get install sudo
2019-05-21 16:55:54 70408 4
原创 升级cuda9.0 到cuda10 报错 Unable to find the module utility `modprobe`
在容器里 升级cuda9.0 到cuda10 ,尝试新的训练环境,先卸载9后,安装10的相关驱动 报如下错[INFO]: ERROR: Unable to find the module utility `modprobe`; please make sure you have the package 'module-init-tools' or 'kmod' installed. If y...
2019-05-21 13:31:07 4967 2
原创 Tensorflow 中earlystopping的使用
参考该文章https://blog.csdn.net/zongza/article/details/85017351报错Key signal_early_stopping/STOP not found in checkpointRestoreV2[dtypes=[DT_FLOAT, DT_FLOAT, DT_FLOAT, DT_FLOAT, DT_FLOAT, ..., DT_F...
2019-05-07 15:43:24 3540 2
原创 TensorFlow: 设置模型保存数量
checkpoint 模型保存数量默认为5个, 为方便管理,调整数量为只保留1个在train.py 中 加入run_config = tf.estimator.RunConfig(save_checkpoints_secs=1e9,keep_checkpoint_max = 1)modle = tf.estimator.Estimator(model_fn=FLAGS.Mod...
2019-05-06 16:59:59 2425 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人