CNN
KCDKFT
Life is war with no mercy.
展开
-
cuda-convnet 在其他数据集上的使用教程
cuda-convnet 是 Alex Krizhevsky 公开的一套CNN代码,运行于Linux系统上,使用GPU做运算,在cuda-convnet中仅仅提供了Cifar数据集的demo,并且网站上并没有说明cuda-convnet代码是如何用于其它数据库的,所以博主我就尝试修改源码,以用于MNIST数据集上,做一个手写数字的识别CNNdemo文章分三个部分:首先,IO模块原创 2014-09-16 16:02:42 · 9416 阅读 · 19 评论 -
Affine Transformation中Rotate Transformation的等价变换
2D图像中的仿射变换种类有平移,旋转,放缩与SHEAR变换,具体公式可以参考http://cn.mathworks.com/discovery/affine-transformation.html最近的工作是为了训练一个网络来回归这些仿射变换参数,比如平移了多少,放缩了多少等等,但是博主发现,当不考虑SHEAR变换的时候,其他三个变换的参数量都能极好的学习,而且泛化性有很好的保障,但是加入了S原创 2016-07-19 15:33:39 · 1095 阅读 · 0 评论 -
关于caffe里面image_data_layer的使用
刚入门caffe的肯定是用demo里面的leveldb格式的数据库,说实话这数据库用起来太麻烦了,所以推荐大家入门到精通都用image_data_layer.cpp使用方法如下所示layer { name: "demo" type: "ImageData" top: "data" top: "label" include { phase: TRAIN }原创 2016-05-05 16:22:22 · 18293 阅读 · 14 评论 -
caffe-stn移植到高版本的方法
本文介绍了将github上开源的stn-caffe代码移植到新版本的caffe的方法原创 2016-04-01 11:00:13 · 4446 阅读 · 10 评论 -
ICDAR2015 Robust Reading Task4参赛感想
Robust Reading的Task 4是今年才推出的比赛,与已经公开多年的Task1和Task2相比,Task4的样本是用手机随机拍摄的生活场景,不是刻意针对文字拍摄的。Task1的图像样例Task2 的图像样例Task4的图像样例比赛要求是只检测人眼可以看出来的文字,比较直观,不做过多赘述。下面是一些我的感想吧。代码原创 2015-04-11 12:15:33 · 8150 阅读 · 13 评论 -
RCNN的安装与简单使用
最近准备从物体检测的角度来重新审视文本检测这个方向,所以看了下CNN大火以后的几篇经典文献,OverFeat,Region CNN, Dense Neural Pattern等等。对这个方向来说,百闻不如一试,趁着其他程序还在跑没什么事,我安装了一下RCNN来看看效果原创 2015-07-03 16:09:01 · 26823 阅读 · 33 评论 -
谈谈如何训练一个性能不错的深度神经网络
深度学习大火,将各个数据集的state of the art不断地刷新,到了开源代码一放出,有种全民皆可刷排名的节奏。不过可别把刷数据想的那么简单,不然大家去哪发paper,怎么混饭吃= = 但是我不想发paper就想占坑刷数据怎么办,看到cifar10都尼玛刷到了95%了,我这用caffe自带的小demo才得出78%的结果,caffe你确定不是在骗我?caffe确实没在骗原创 2015-05-18 16:25:14 · 12932 阅读 · 6 评论 -
胡言乱语找节奏 —— 什么才是机器学习的未来
模板匹配什么才是描述像不像的最直白简单的算法——KNN什么才是学习出最贴近人的认知的模板匹配算法——KMEAN?KMEDOID?or other clustering methods?什么样的结构最贴近人的认知生成模型进化 -> 生成+判别模型判别模型应该只是一种认知的一种,不是认知的全部,认知的全部应该是有概念的,但是判别模型却没法体现这一点但是并不是说有原创 2015-04-27 17:14:48 · 1409 阅读 · 0 评论 -
caffe中cifar10的full_train模型出现nan的解决办法
caffe在cifar10 的example上给出了两个模型,一个是quick模式,一个是full模式,训练full模式时会出现loss=nan的错误原创 2014-12-24 10:53:52 · 15040 阅读 · 10 评论 -
如何在caffe中添加新的Layer
本文分为两部分,先写一个入门的教程,然后再给出自己添加maxout与NIN的layer的方法原创 2014-12-11 15:37:52 · 47892 阅读 · 37 评论 -
哺乳动物视觉皮层的深层结构研究
哺乳动物视觉皮层的深层结构研究参考文献 Deep Hierarchies in the Primate Visual Cortex : what can we learn for computer vision ?----------------------------------------------------------------------------------------------------------原创 2014-12-07 11:29:26 · 2639 阅读 · 0 评论 -
CNN中感受野的计算
感受野(receptive field)是怎样一个东西呢,从CNN可视化的角度来讲,就是输出featuremap某个节点的响应对应的输入图像的区域就是感受野。比如我们第一层是一个3*3的卷积核,那么我们经过这个卷积核得到的featuremap中的每个节点都源自这个3*3的卷积核与原图像中3*3的区域做卷积,那么我们就称这个featuremap的节点感受野大小为3*3如果再经过pooling原创 2015-07-10 15:38:08 · 49177 阅读 · 20 评论