CVPR2019 微软亚研分享会
- “Perceive where to focus:learning visibilityaware part features for partial person reidentification” 行人再识别
- “Deeper and wider siamese networks for real-time visual tracking” 多帧跟踪
- “Visual Tracking via daptive Spatially Regularized Correlation Filters” 单目标跟踪
- “Self-Supervised Convolutional Subspace Clustering Network” 低维子空间聚类
- “Progressive Teacher-student Learning for Early Action Prediction” 行为预测
- “Single-Image Piece-wise Planar 3D Reconstruction via Associative Embedding” 3D重建任务
- “SeerNet: Predicting Convolution Neural Network Feature-Map Sparsity through Low-Bit Quantization” 稀疏性计算提升计算效率
- “Multi-label image recognition with graph convolutional networks” GCN 图网络
分享会视频:转自AI研习社
“Perceive where to focus:learning visibilityaware part features for partial person reidentification” 行人再识别
清华大学 行人再识别
- 【问题】:行人部分可见(部分被遮挡会引入噪声);
- 【方法&创新】:region部件特征提取,可见部分给高评分,否则给低评分;
- 【创新】:VPM(Visibility-aware Part Model)分块为可见部分和不可见部分,构建自监督的过程;
- 【方法】三个Loss:人体Loss、ID、不同ID鉴别;
将人体分多个区域,感知出现区域,共享区域和已知区域对比;
“Deeper and wider siamese networks for real-time visual tracking” 多帧跟踪
微软亚研 Visual Object Tracking:多帧跟踪
-
【孪生卷积网络】:
Siamese Trackers:孪生卷积网络【共享输入和参数】
Feature Space更具有鲁棒性;
SiamFC:给模版和区域,在区域搜索模板,得到Score Map;
SiamRPN:跟从SiamFC,上是分类,下是回归; -
【工作出发点和动机】:
SiamFC和SiamRPN替换AlexNet为更深的网络;
提升网络难以提升好效果;
Padding:加上会降低->加上后为0边缘的padding,造成网络看到的0边缘和原图不一样; -
【网络流程】:
替换SiamFC和SiamRPN;
训练:从后向前逐步释放Layer
“Visual Tracking via daptive Spatially Regularized Correlation Filters” 单目标跟踪
大连理工 单目标跟踪
- 【问题】相关滤波自适应跟踪算法和CNN网络研究,500帧达到瓶颈;
- 【方法】CF框架和CNN结合框架;
- 【方法】相关滤波:
提取多目标检测窗口 - FFT - CNN - DFFT
高亮部分会导致学习滤波器有影响;
增加自适应空间正则;
“Self-Supervised Convolutional Subspace Clustering Network” 低维子空间聚类
北邮 李春光 高维数据在低维子结构中【低维子空间聚类】
-
构建相似度矩阵;
-
构建相似点聚类;
-
如何构建好的相似度矩阵:高维空间之中空间信息不好用;
-
自表示模型 用点和其他点的相似度系数表示该点的位置;
原始表示不能符合低维子空间分解
传统:核方法、矩阵分解
MLP+SSC -> DSCNET 谱聚类
“卷积 特征抽取 普聚类”合成一起;
“Progressive Teacher-student Learning for Early Action Prediction” 行为预测
中山大学 行为预测 Teacher Student 网络结构
-
分为两个问题:
行为识别:动作完成检验;
行为预测:动作未做 预先知道; -
提取RGB三通道特征:
Teacher:双向LSTM;
Student:单向LSTM; -
数据库:NTU RGB+D、SYSU 3D HOI、UFG-101;
“Single-Image Piece-wise Planar 3D Reconstruction via Associative Embedding” 3D重建任务
上海科技大学 3D重建任务
-
给定二维图片 推断3维结构
对称重复结构 匹配存在问题 -
3D重建基于现实世界每个物体 平行/垂直/等 关系
区分不同平面,对估计的每个区域划分 -
PPGNet:Learning Point-Pair Graph for Line Segment Detection
本文对人造环境效果好,不一定适用于自然环境;
“SeerNet: Predicting Convolution Neural Network Feature-Map Sparsity through Low-Bit Quantization” 稀疏性计算提升计算效率
微软亚研 稀疏性计算提升计算效率
训练时将connection为0的矩阵扔掉;
Accuracy和Speed up 不能两全;
Relu负值变为0,MaxPooling取最大值;
卷积 前用低比特计算出mask,仅用Cuda计算mask中的正值;
“Multi-label image recognition with graph convolutional networks” GCN 图网络
旷视 GCN图网络
- 单图像中存在多个label物体,训练多个二分类器;
- 识别语义关系,并找出相关性-例如在天空中将鱼的label降低;
- 腾讯数据集:ML-Image;