PS: Unsupervised Learning of Visual Representations Using Videos___ICCV2015

Unsupervised Learning of Visual Representations Using Videos
Xiaolong Wang, Abhinav Gupta
文章链接

这篇文章技术都是老技术,idea也很容易想。比较中规中矩的一篇文章。现在做视频unsupervised learning的想法都是先通过视频的连续性,通过帧间的关系,判断相邻帧同时出现但有点差异的两个区域是否是一个物体作为supervised learning的label。这篇文章对当前新潮的技术进行了组合。
1.通过patch tracking得到训练图像。由于youtube视频分辨率比较低,噪声大,论文没有采用optical flow的方法,而是采用了Improved Dense Trajectories来跟踪移动的物体。
2.Siamese Triplet Network。不赘述了,已经存在很多。
3.Hard Negative Mining。这一步主要是提高CNN收敛速度采用的,最近两年的paper也比较常见。

总体来说,组合的还是不错的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值