郑哲东的博客

计算机视觉 行人再识别 person re-ID

排序:
默认
按更新时间
按访问量

阅读小结:Improved Techniques for training GANS

github地址:https://github.com/openai/improved-gan/ What: 提出了对于GANs新的结构和训练过程。主要focus在两个应用:半监督学习 和  更好的图像产生。 对于G,不要求一个和test data和像的模型,也不要求不使用label。 实验中...

2016-09-02 13:40:27

阅读数:5602

评论数:9

阅读小结:Unsupervised Representation with Deep Convolutional Generative Adversarial Networks

What CNN应用于无监督学习。将这种CNN称为DCGANs 1.提出和评估了DCGANs 有一些结构上的限制,让他可以stable的去训练。 2.利用图像分类任务训练的discriminator,证明了他们有无监督学习的潜力。(这是迁移学习?) 证明了他们的adversarial pair学习...

2016-08-27 22:38:32

阅读数:1602

评论数:2

阅读小结:Generative Adversarial Nets

这是Ian Goodfellow大神的2014年的paper,最近很火,一直没看,留的坑。 中文应该叫做对抗网络 What: 同时驯良两个模型:一个生成模型G(获得数据分布),一个区分模型D(预测输入是真实的,还是G中产生的) G的训练目标就是最大化D犯错误的可能,这样G这个生成模型就越厉害。...

2016-08-26 15:03:44

阅读数:6168

评论数:0

阅读小结: Artist style transfer for videos

这篇paper存了好久,一直没有看。今天补了 What: 看了这个youtube视频就可以感受到了。视频上做Artist Style十分酷炫! https://www.youtube.com/watch?v=Khuj4ASldmU 看前的问题: 我自己写过单帧的Art...

2016-08-25 11:37:51

阅读数:1236

评论数:0

阅读小结:Correlational Neural Networks

What: auto encoder的升级版   显式的 最大化当投影到同一空间时views之间的联系 (这里的view指的是图像,声音这种不同的输入源) 比如视频分类任务中就想把声音结合进去。 Formally Define这个任务是: 我们有一组数据Z,每个Z是由特征X,和特征Y conc...

2016-08-18 14:45:55

阅读数:366

评论数:0

阅读小结:CNN Image Retrieval Learns from BoW:Unsupervised Fine-Tuning with Hard Example:CNN Image Retrie

What: 图像检索的一篇文章, 由于数据集的问题,ft以后在Holiday上 VGGNET    82.5   在Oxford 5k上结果(cropi) VGGNET 79.1 How:  提出了了一个无监督收集的数据集 主要讲了收集的策略。

2016-08-12 21:19:01

阅读数:1641

评论数:0

matlab中在图像上划线 画圈的方法

其实用plot都可以搞定。  plot(imp(:,1),imp(:,2),'ro'); %最后的‘ro’,r是代表红色,o是代表画圈。画圈的话可以提供多个点的坐标,我这里用的就是向量的形式。   plot(imp(1:2,1),imp(1:2,2)); %划线 提供两个xy坐标,然后plo...

2016-08-03 12:53:54

阅读数:11331

评论数:0

如何加强神经网络训练

1. 扩大数据集 调研CUHK01/CUHK03 2.做数据增强 旋转,翻转,平移 3.triplet loss 4.结构问题 5.multi-task

2016-07-22 16:56:50

阅读数:665

评论数:0

Spatial Transformer Layer 实验结果 及 分析

序言: ST Layer在distorted minist数据集上表现出了很好的结果,但毕竟distorted minist是一个简单的数据集。(手写单个数字分类,所以共10类) 所以在本篇文章中,先会解释一部分,STLayer的原理,然后解释一部份minist上面的操作,最后解释一下我在mark...

2016-07-20 10:34:54

阅读数:1235

评论数:1

cuda 安装方法

实验室的服务器又挂了。。。。真的日了狗了。。 写下来,以防自己以后还要装。 http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html#axzz4ESw6hG2k

2016-07-15 16:54:14

阅读数:555

评论数:0

阅读小结Deep Metric Learning via Lifted Structured Feature Embedding

What: 这是一篇讲图像retrieval的工作。也就是通过一张图片去搜索相关图片。比较直观的问题在于图像的传统问题 -类内差异 (比如同一物体在不同pose下的照片) -类间相似(比如不同物体在同一pose下的照片) 然后比较diao的地方是,zero-shot learning没有学习过,直...

2016-07-10 22:31:16

阅读数:3238

评论数:3

阅读小结An Improved Deep Learning Architecture for Person Re-Identification

Author: Ejaz Ahmed,Michael Jones and Tim K. Marks  http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Ahmed_An_Improved_Deep_2015_CVPR_...

2016-07-09 19:28:12

阅读数:1901

评论数:8

阅读小结Improving Person Re-identification via Pose-aware Multi-shot Matching

Authors:Yeong-Jun Cho and Kuk-Jin Yoon  What: Person Reid 识别多个摄像头下的行人是否为同一人 Motion: 由于camera viewpoint 和 person pose带来的外形巨大改变,故提出了 Pose-aware Mult...

2016-07-09 01:07:31

阅读数:1696

评论数:1

CMS-RCNN阅读小结

阅读前疑问: 1.FasterRCNN的RPN 本来就是multi-scale的,印象中有27种,这篇文章针对人脸检测有什么改进么? 2.contextual是怎么结合附近信息? 驱动: 1.小的人脸使用rcnn难以检测 原始RCNN 一方面reception field大,所以...

2016-07-08 16:35:54

阅读数:1772

评论数:0

Convolutional Pose Machines 阅读小结

Title: Convolutional Pose Machines Authors: Shih-En Wei, Varun Ramakrishna, Takeo Kanade, Yaser Sheikh Link: https://arxiv.org/abs/1602.00134 Githu...

2016-07-07 22:20:40

阅读数:5262

评论数:2

一个新的开始

我即将开始我的博士生涯。 之所以开了这个博客,是希望能记录下自己的点滴以及对看过论文的小结。 我知道这肯定会很苦,不像本科的时候,懒的话很多事情可以糊弄过去,不负责任。 要push 自己努力去变成一个靠谱的人。 最近看的书上有这么一句话: God,  grant me the serenity t...

2016-07-06 22:27:12

阅读数:885

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭