- 博客(6)
- 资源 (92)
- 收藏
- 关注
原创 Group Normalization
FAIR 团队,吴育昕和恺明大大的新作Group Normalization。主要的优势在于,BN会受到batchsize大小的影响。如果batchsize太小,算出的均值和方差就会不准确,如果太大,显存又可能不够用。而GN算的是channel方向每个group的均值和方差,和batchsize没关系,自然就不受batchsize大小的约束。从上图可以看出,随着batchsize的减小,GN的表现...
2018-03-26 18:40:43 9577 10
原创 年龄识别数据集IMDB-WIKI
ICCV,2015, DEX: Deep EXpectation of apparent age from a single image文章3个insight:(1)分享了IMDB-WIKI数据集,包含524230张从IMDB 和Wikipedia爬取的名人数据图片。具体数据分布如下图: (2)一个新颖的化回归为分类的年龄算法。本质就是在0-100之间的101类分类后,对...
2018-03-21 09:02:16 10822 1
原创 空间变换网络STN
出自论文Spatial Transformer NetworksInsight:文章提出的STN的作用类似于传统的矫正的作用。比如人脸识别中,需要先对检测的图片进行关键点检测,然后使用关键点来进行对齐操作。但是这样的一个过程是需要额外进行处理的。但是有了STN后,检测完的人脸,直接就可以做对齐操作。关键的一点就是这个矫正过程是可以进行梯度传导的。想象一下,人脸检测完了,直接使用R
2018-03-10 19:20:40 28079 6
原创 边缘检测之HED
出自论文,Holistically-Nested Edge Detection ,ICCV2015,Marr奖提名,非常值得看的一篇。边缘检测的工作分为以下3个研究方向:(1)传统的检测算子:Sobel ,Canny(2)基于信息理论设计的手工特征:Statistical Edges ,Pb ,gPb(3)基于学习方法设计的手工特征:BEL , Multi-scale ...
2018-03-07 20:48:52 30055 8
原创 基于多输出顺序回归的年龄识别
源自2016 cvpr,Ordinal Regression with Multiple Output CNN for Age Estimation ,文章主要2个贡献:(1)将传统的年龄回归问题转化为多个顺序2分类问题文章网络的整体结构如下图所示: 在经过3个卷积模块后,接入一个全连接层,然后输出K-1个通道的2分类任务。例如这里,Task1预测年龄是否大于1,Tas...
2018-03-06 16:40:17 4794
原创 中文街景数据集CTW
源自论文,Chinese Text in the Wild主要包含32285张图片,共计1018402个汉字,3850个汉字类别。主要来自清华-腾讯100K数据集和腾讯街景数据集。图片大小为2048*2048。其中训练集:检测测试集:识别测试集=8:1:1该数据集可以用于自然场景文字的检测和识别2个任务。 Annotation 包括:(1) 每个汉字的检测框(2) 一行汉字的检测框(3) 是否遮挡...
2018-03-05 15:00:54 10828 3
2014facebookDeepLearningforVision:TricksoftheTrade.pdf
2017-03-02
VOC2007xml.zip
2016-12-02
CarFace-Detection-Adaboost.zip
2017-09-13
( libboost.zip )
2017-09-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人