计算机视觉
文章平均质量分 96
视觉论文研读以及部署应用
郑烯烃快去学习
今天不想跑 所以才去跑
展开
-
《Attention Is All You Need》
论文地址:https://arxiv.org/abs/1706.03762谷歌于2017年发布论文《Attention Is All You Need》,提出了一个只基于attention的结构来处理序列模型相关的问题,比如机器翻译。相比传统的CNN与RNN来作为encoder-decoder的模型,谷歌这个模型摒弃了固有的方式,并没有使用任何的CNN或者RNN的结构,该模型可以高度并行的工作,相比以前串行并且无法叠加多层、效率低的问题。那么Transorformer可以高度并行的工作,所以在提升翻译原创 2022-05-25 21:05:41 · 3427 阅读 · 0 评论 -
源码阅读及理论详解《 Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting 》
Informer 是 AAAI 2021的best paper。主要focus在长序列预测。通过修改transformer的结构,提高transformer的速度。原创 2022-06-05 23:06:11 · 12026 阅读 · 36 评论 -
DeepLearning与CNN入门基础总结
由于想入门深度学习的一些框架,所以就自己开始学习了关于深度学习的入门知识以及python代码的实现过程。对于下面的文章的基础是掌握一定的python还有numpy的技巧。而且这篇文章真的是像我这种没有接触过的入门者而言,所以对于掌握很多东西的大佬就可以没有必要看我这篇文章了。神经网络可能大家听起来确实是一个有挑战性的事情,其实它的本质是一个线性回归以及逻辑回归的问题。那么我们回过头看看机器学习的流程:数据获取->特征工程->建立模型->评估与应哟。那么深度学习是在干什么的:其实原创 2022-05-17 21:15:01 · 999 阅读 · 0 评论 -
Person re-identification行人重识别(二)——实战
基于行人局部特征融合的再识别实战原创 2022-10-09 09:54:58 · 1591 阅读 · 2 评论 -
Person re-identification行人重识别(一)
行人重识别,简单来说就是要在不同时间、地点或者相机上匹配到一个特定的人,属于图像检索的内容。其难点和核心便在于如何从杂乱的背景、姿态的多样性以及存在遮挡等各种复杂多变的情况下,有效地从人像图像中鉴别并提取视觉特征(即区分出不同的人)。原创 2022-09-26 22:35:20 · 3558 阅读 · 0 评论 -
旷视研究院CVPR2020--《Learning Relation and Topology for Occluded Person Re-Identification》
在研究行人重识别的时候意外的关注到了旷视科技,这个论文主要在于**解决被遮挡的人重新识别(ReID)的目的是通过非关节摄像机将被遮挡的人图像与整体图像进行匹配**。旷视科技研究团队在这篇论文中提出了一个新的框架用于解决遮挡问题,并取得了一定的效果。为了获得遮挡ReID更加鲁棒性的对齐能力,本文提出了一种新的框架,来学习具有判别力特征和人体拓扑信息的高阶关系。原创 2022-10-10 12:22:35 · 2037 阅读 · 4 评论 -
PointNet++:Deep Hierarchical Feature Learning on Point Sets in a Metric Space
针对于PointNet出现的问题:没有能力捕获局部结构,这使得在复杂的场景中很难应用。PointNet++的作者主要通过两个主要的方法进行了改进,使得网络能更好的提取局部特征: 一是利用空间距离(metric space distances),使用PointNet对点集局部区域进行特征迭代提取,使其能够学到局部尺度越来越大的特征。 二是由于点集分布很多时候是不均匀的,如果默认是均匀的,会使得网络性能变差,所以作者提出了一种自适应密度的特征提取方法。原创 2022-10-12 11:43:45 · 1743 阅读 · 1 评论