- 博客(54)
- 资源 (6)
- 收藏
- 关注
原创 阅读小结:Generative Adversarial Nets
这是Ian Goodfellow大神的2014年的paper,最近很火,一直没看,留的坑。中文应该叫做对抗网络What:同时驯良两个模型:一个生成模型G(获得数据分布),一个区分模型D(预测输入是真实的,还是G中产生的)G的训练目标就是最大化D犯错误的可能,这样G这个生成模型就越厉害。这个框架很像两个人在玩游戏。整个系统里只用了bp,没有马尔可夫链或者其他推理的神经
2016-08-26 15:03:44 7355
原创 阅读小结: Artist style transfer for videos
这篇paper存了好久,一直没有看。今天补了What:看了这个youtube视频就可以感受到了。视频上做Artist Style十分酷炫!https://www.youtube.com/watch?v=Khuj4ASldmU看前的问题:我自己写过单帧的Artist Style (https://github.com/layumi/2016_Artist_St
2016-08-25 11:37:51 2101
原创 阅读小结:Correlational Neural Networks
What:auto encoder的升级版 显式的 最大化当投影到同一空间时views之间的联系 (这里的view指的是图像,声音这种不同的输入源)比如视频分类任务中就想把声音结合进去。Formally Define这个任务是:我们有一组数据Z,每个Z是由特征X,和特征Y concat起来的 (比如X来自视频的图像,Y来自视频的音频)1.首先 h1(X) 和 h
2016-08-18 14:45:55 1039
原创 阅读小结:CNN Image Retrieval Learns from BoW:Unsupervised Fine-Tuning with Hard Example:CNN Image Retrie
What:图像检索的一篇文章,由于数据集的问题,ft以后在Holiday上 VGGNET 82.5 在Oxford 5k上结果(cropi) VGGNET 79.1How: 提出了了一个无监督收集的数据集主要讲了收集的策略。
2016-08-12 21:19:01 2903
原创 matlab中在图像上划线 画圈的方法
其实用plot都可以搞定。plot(imp(:,1),imp(:,2),'ro'); %最后的‘ro’,r是代表红色,o是代表画圈。画圈的话可以提供多个点的坐标,我这里用的就是向量的形式。plot(imp(1:2,1),imp(1:2,2)); %划线 提供两个xy坐标,然后plot默认就会划线plot(imp(3:5,1),imp(3:5,2));plot(imp(6
2016-08-03 12:53:54 43795 1
原创 如何加强神经网络训练
1. 扩大数据集调研CUHK01/CUHK032.做数据增强旋转,翻转,平移3.triplet loss4.结构问题5.multi-task
2016-07-22 16:56:50 1110
原创 Spatial Transformer Layer 实验结果 及 分析
序言:ST Layer在distorted minist数据集上表现出了很好的结果,但毕竟distorted minist是一个简单的数据集。(手写单个数字分类,所以共10类)所以在本篇文章中,先会解释一部分,STLayer的原理,然后解释一部份minist上面的操作,最后解释一下我在market1501上的实验以及结果分析解释:ST Layer是一个 由 6个参数 和原图
2016-07-20 10:34:54 2084 1
原创 cuda 安装方法
实验室的服务器又挂了。。。。真的日了狗了。。写下来,以防自己以后还要装。http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html#axzz4ESw6hG2k
2016-07-15 16:54:14 1255
原创 阅读小结Deep Metric Learning via Lifted Structured Feature Embedding
What:这是一篇讲图像retrieval的工作。也就是通过一张图片去搜索相关图片。比较直观的问题在于图像的传统问题-类内差异 (比如同一物体在不同pose下的照片) -类间相似(比如不同物体在同一pose下的照片)然后比较diao的地方是,zero-shot learning没有学习过,直接test(和以前我们常用的vgg模型提取特征的感觉一样)Motivation:
2016-07-10 22:31:16 4289 4
原创 阅读小结An Improved Deep Learning Architecture for Person Re-Identification
Author: Ejaz Ahmed,Michael Jones and Tim K. Marks http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ahmed_An_Improved_Deep_2015_CVPR_paper.pdfMotivation:利用神经网络同时提取特征和相似矩阵学习来
2016-07-09 19:28:12 2773 9
原创 阅读小结Improving Person Re-identification via Pose-aware Multi-shot Matching
Authors:Yeong-Jun Cho and Kuk-Jin Yoon What:Person Reid 识别多个摄像头下的行人是否为同一人Motion:由于camera viewpoint 和 person pose带来的外形巨大改变,故提出了 Pose-aware Multi-shot Matching (PaMM) 分析这两种问题(由于多个摄像头的设置
2016-07-09 01:07:31 2328 1
原创 CMS-RCNN阅读小结
阅读前疑问:1.FasterRCNN的RPN 本来就是multi-scale的,印象中有27种,这篇文章针对人脸检测有什么改进么?2.contextual是怎么结合附近信息?驱动:1.小的人脸使用rcnn难以检测原始RCNN 一方面reception field大,所以小的脸占的比例就小,混入的背景信息就多了;另一方面,小的脸几次stride2以后到conv5太小了。
2016-07-08 16:35:54 3075
原创 Convolutional Pose Machines 阅读小结
Title: Convolutional Pose MachinesAuthors: Shih-En Wei, Varun Ramakrishna, Takeo Kanade, Yaser SheikhLink: https://arxiv.org/abs/1602.00134Github: https://github.com/CMU-Perceptual-Computi
2016-07-07 22:20:40 6818 6
原创 一个新的开始
我即将开始我的博士生涯。之所以开了这个博客,是希望能记录下自己的点滴以及对看过论文的小结。我知道这肯定会很苦,不像本科的时候,懒的话很多事情可以糊弄过去,不负责任。要push 自己努力去变成一个靠谱的人。最近看的书上有这么一句话:God, grant me the serenity to accept the things I cannot change,courage
2016-07-06 22:27:12 1321 2
ZhedongZheng_图文双向检索_图文互搜.pdf
2020-12-30
ACM-MM-Talk 无人机演讲.pdf
2020-12-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人