几篇论文


来自微信公众号paperweekly,里面集中在文本方向。

1.Learning to Rank Short Text Pairs with Convolutional Deep Neural Networks

这是一篇相当经典的 Siamese 网络模型,类似架构可以通过改变左右两边的网络结构而适用于各种 task。

如果把右侧网络输入换成 Label,则可以用于实现http://yann.lecun.com/exdb/publis/pdf/lecun-06.pdf.

2.Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

CVPR 2017:多人姿态实时估计,这里主要亮点还是多人实时+效果.本文算法主要流程如下:输入一幅图像,经过卷积网络提取特征,得到一组特征图,然后分成两个岔路,分别使用 CNN 网络提取 Part Confidence Maps 和 Part Affinity Fields ,得到这两个信息后,我们使用图论中的 Bipartite Matching 将同一个人的关节点连接起来得到最终的结果。

3.In Defense of the Triplet Loss for Person Re-Identification

对 triplet loss 的一个讨论,里面的 batch hardmining 非常好用。


Adversarial Representation Learning for Domain Adaptation

ARDA 将 classifier、encoder 以及 discriminator 三者共同训练,思路不错

https://github.com/corenel/pytorch-arda


Unsupervised Image-to-Image Translation Networks

The proposed framework can learn the translation function without any corresponding images in two domains.

https://github.com/leehomyc/Img2Img-Translation-Networks


A Discriminatively Learned CNN Embedding for Person Re-identification

在行人识别领域有两类流型的模型(都是基于 CNN),一类是 verification model,一类是 identification model,由于损失函数不同,两类模型各有优缺点。

verification model 以图片对作为输入,经过一个非线性函数(CNN),得到特征后进行相似度判断,这样只利用到了弱的 Re-id 标签。identification model 训练时是以一张图片作为输入,经过一个非线性函数(CNN),得到特征,然后进行多类判断。

在测试阶段,把两张图片经过全连接的网络,得到特征,然后再做相似度判断。identification model 虽然利用了更多的标注信息,但是训练的目标并不直接是行人重识别。

本文的创新之处,是结合两类模型,学习一个更有区分度的行人识别判别器。实验效果表明,本文提出的融合模型,在 Market1501 和 CUHK 数据集都比基础的两类模型有效果提升,并且该模型还可以运用在图片检索领域。

https://github.com/D-X-Y/caffe-reid
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值