计算机视觉
wang2008start
这个作者很懒,什么都没留下…
展开
-
用tensorflow改写个网络碰到的各种异常问题(数据集cifar)
用tf改写了个网络结构,这里没有使用keras,tflearn等,是自己手写的。网络结构参照他处的。训练的时候首先遇到的就是各种shape不匹配的问题,来来回回修改几次之后,把下面的几个主要用到的函数记录下来,这些设置或使用正确后,基本就没有什么问题了。各种网络结构都ok了。numpy.transposetrain_data = np.transpose(train_data, (3,原创 2017-04-28 15:12:17 · 2438 阅读 · 0 评论 -
斯坦福大学CS231课程笔记1
从线性回归到神经网络 Mini-batchSGD 正向传播计算loss反向传播计算梯度,根据梯度更新参数 图的拓扑排序正向和反向 BatchNormalization 批量正则化 优势:提升梯度流向,可是使用更大的学习率;减少对初始化的依赖;由正则化的作用,减少dropout的使用 激活函数 数据预处理 学习率 loss不下降,学习率太小 loss爆炸,学习率太大,出现Nan时,原创 2017-10-13 12:03:22 · 3289 阅读 · 0 评论 -
生成对抗网络GAN损失函数Loss的计算
损失函数的计算辨别器对假数据的损失原理相同,最终达到的目标是对于所有的真实图片,输出为1;对于所有的假图片,输出为0。 生成器的目标是愚弄辨别器蒙混过关,需要达到的目标是对于生成的图片,输出为1.`d_loss_real = tf.reduce_mean( tf.nn.sigmoid_cross_entropy_with_logits(logits=d_log原创 2017-07-31 15:24:07 · 33578 阅读 · 4 评论 -
tensorflow模型save和restore
把tensorflow每个阶段训练的模型进行保存,供后面预测或者进一步训练时使用。保存的时候使用saver.save()方法,恢复的时候使用saver.restore方法。详细如下:初始信息flags.DEFINE_integer('epochs', 100, '') #FLAGS.epochsflags.DEFINE_integer('display_steps', 10, 'Number of原创 2017-09-28 16:26:09 · 885 阅读 · 0 评论 -
caffe图像可视化(一)——featuremap可视化
caffe在进行图像训练时,对特征或中间结果进行可视化,可以帮助更好的对训练过程和图像的理解。 caffe中的可视化,最简单的一种是,直接把featruemap或者中间result用图像表示出来,如下,先定义一个图像表示函数,对于数组维数不足的,padding补足。def vis_square(data, padsize=1, padval=0): data -= data.min()原创 2017-09-22 15:32:58 · 2912 阅读 · 0 评论 -
caffe图像可视化(二)——反卷积可视化
caffe在进行图像训练时,对特征或中间结果进行可视化,可以帮助更好的对训练过程和图像的理解。 caffe中的可视化,另一种是把网络中间的某层,做卷积的相反动作,用于把某层还原成原来的图像。卷积和反卷积时,使用的参数是共享的,都是卷积时学习到的参数。如下:#加载网络和逆向网络net = caffe.Net('deploy.prototxt', 'model.caf原创 2017-09-22 16:09:43 · 2079 阅读 · 4 评论 -
caffe学习
caffe整体架构说明纯粹的C++/CUDA架构,支持命令行,Python和MATLAB接口,可在CPU和GPU间无缝切换;模型的定义与最优化设置以及预训练的权重等都是以文本形式给出, Caffe层定义由层属性和层参数组成 Blob 是用以存储数据的4维数组 对于数据:Number*Channel*height*width 对于卷积权重:Output*Input*Height*width原创 2017-05-27 15:57:52 · 449 阅读 · 0 评论 -
Caffe CentOS64位 GPU安装
本文假设普通的yum,pip,git等都已安装好。 1. sudo yum install protobuf-devel leveldb-devel snappy-devel opencv-devel boost-devel hdf5-develsudo yum install openblas-devel.x86_64 gcc-c++.x86_64 numpy.x86_64 scipy.x86原创 2017-05-12 17:32:22 · 698 阅读 · 0 评论 -
手写数字识别mnist-demo 代码整理总结
当于深度学习的Hello Worldgit地址:https://github.com/Eniac-Xie/PyConvNet.git主要代码结构:0.initial_LeNet.py 组建LeNet网络结构1.conv_net.py 主要方法:add_layer,forward,backword,train,predict2.layer.py 主要方法:conv_forw原创 2017-04-22 22:18:15 · 2044 阅读 · 0 评论 -
斯坦福大学CS231课程笔记2
CNN CV TasksClassificationClassification + LocalizationClassification:C classes Input:Image Output: Class label Evaluation metric: Accuracy Localization Input:Image output:Box in the image(x,y,w原创 2017-10-14 00:28:46 · 952 阅读 · 0 评论