Tensorflow
木水_
这个作者很懒,什么都没留下…
展开
-
exceeds 10% of system memory--------fatal python error: aborted
我在用 tensorflow 写的深度学习模型进行前向传播的时候,连续跳出几个 exceeds 10% of system memory,紧跟着就是:fatal python error: aborted。 跑程序的时候,我打开任务管理器,但是发现内存并没有满,所以也不知道底层是哪里的问题。 不过可以肯定的是前向传播的时候内存不够。于是我把输入图片的尺寸减小(中间有resize的操作),这个报错就没再出现了。...原创 2021-01-17 19:29:03 · 1755 阅读 · 0 评论 -
tensorflow 中的深度可分离卷积接口 slim.separable_conv2d()
我在前面的一篇博客深入浅出谈谈深度可分离卷积中介绍了深度可分离卷积的原理,然后用 tensorflow 实现了下。 在 tensorflow 中的接口是slim.separable_conv2d(),接口说明:def separable_convolution2d( inputs, num_outputs, kernel_size, depth_multiplier=1, stride=1, padding='SAME', ...原创 2020-11-24 14:55:36 · 3872 阅读 · 2 评论 -
tensorflow 如何减少网络层并微调参数
当你的模型需要剪裁的时候,可以采用减少原网络结构的层数,达到简化的目的,那么如何训练新的网络参数呢? 如果我没弄错的,修改网络架构后,可直接导入原网络架构,然后采用相同的训练数据进行训练,可以得到修改后的新网络的参数。这样训练的时候,导入原网络模型的图和参数后,内部会根据索引对比。保留的原有层的参数在训练的时候进行微调,从而实现裁剪的网络快速训练目的。 如果不对请指正。path = '/model/checkpoints/' ...原创 2020-08-28 14:24:17 · 520 阅读 · 2 评论 -
tensorflow 模型转 caffe 模型的相关细节和部分代码
tensorflow 和 caffe 都是常见的深度学习框架,有时候前端部署会因为平台的要求只能用其中的某种框架,这个时候则需要进行框架间的转换。本博客会介绍 tensorflow 转 caffe 模型的相关细节和部分相应的代码。1 有哪些转换方法 我做了简单的查阅,发现主要是下面三种:1) 利用 net.params 逐层添加参数2) prototxt 中逐层添加参数后编译成 caffemodel 我阅读了大佬的专栏,学习良多(地址:tensorflow2caffe...原创 2020-07-10 15:24:49 · 959 阅读 · 5 评论 -
tensorflow restore 时报错:ValueError: Can‘t load save_path when it is None.
我用的是 tensorflow 1.9 GPU 版本,模型意外中断后想继续训练模型。使用 restore 的时候出现了如题的报错。经过检查,发现是缺乏 checkpoint 文件。 tensorflow 在保存模型时,会产生以下四个文件:存储网络结构.meta、存储训练好的参数.data和.index、记录最新的模型checkpoint。 当使用saver.resto...原创 2020-03-03 15:22:10 · 6757 阅读 · 7 评论 -
深度学习训练环境离线搭建:CentOS7 linux 服务器安装 tensorflow_gpu1.9、cuda9、cudnn7、anaconda3-4.3、python3.6
1 简述 最近需要在CentOS7 linux 服务器上配置深度学习的训练环境。 那么,该怎么做呢? 对于一台服务器,首先得实现连网,然后进行远程登陆。 其次,搞清楚安装什么软件,如何安装,有哪些依赖项需要提前安装。 最后,需要进行简单的测试验证是否成功安装。 难点,一般公司的服务器可能不通外网,不能使用那些一键安装指令。 基...原创 2019-12-19 20:54:47 · 986 阅读 · 0 评论 -
Tensorflow 多 GPU 训练方法
现代工作站可能会包含多个用于科学计算的 GPU。默认情况下,Tensorflow 采用一个 GPU 训练模型。TensorFlow 可利用此环境在多个卡上同时运行训练操作。如果要以并行的分布式方式训练模型,则需要协调训练过程。1 原理说明 TensorFlow并行计算分为:模型并行,数据并行。模型并行是指根据不同模型设计不同的并行方式,模型不同计算节点放在不同...原创 2019-01-19 15:19:58 · 2318 阅读 · 1 评论 -
Keras 踩坑记录: Keras 后端 Backend
1 问题起源 博主最近在跑一个 github 上面的基于 Keras 的深度学习模型的时候发现如下的报错:ValueError: Negative dimension size caused by subtracting 2 from 1 for 'MaxPool_21' (op: 'MaxPool') with input shapes: [?,1,128,128]. 初...原创 2019-02-21 16:59:30 · 1630 阅读 · 0 评论