点击上方“AI算法与图像处理”,选择加"星标"或“置顶”
重磅干货,第一时间送达
编辑:AI算法与图像处理
来源:知乎 https://www.zhihu.com/question/320330671/answer/738260594
本文仅用于学术交流分享,如有侵权请联系删除
知乎提问:
本人小白一枚,看了很多深度学习,机器学习以及图像处理等视频和书之后,理论有一些长进,但是实际运用能力不足,从反面也是由于理论认识不足所致,所以想问问各位大佬有没有好的项目,提升下自身能力
作者 :微软亚洲研究院
链接:https://www.zhihu.com/question/320330671/answer/738260594
微软亚洲研究院视觉计算组资深研究员王井东博士和研究员元玉慧博士为大家推荐来自微软亚洲研究院众多项目,共分为目标检测、语义和实例分割、人体姿态估计、人脸对齐、高效和轻量级卷积神经网络结构设计、行人再识别、视频目标检测、目标跟踪、最近邻搜索等领域。
目标检测
1. HRNet-Object-Detection
微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,提高了目标特别是小目标检测的空间精准率。支持multi-scale sync-bn 训练。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/4dcf7466a9ffdb3fb6ca92ef55b6f0f1.jpeg)
代码:https://github.com/HRNet/HRNet-Object-Detectionhttps://github.com/HRNet/HRNet-MaskRCNN-Benchmarkhttps://github.com/HRNet/HRNet-FCOS
论文:https://arxiv.org/pdf/1904.04514.pdf
2. Deformable convolutional networks
微软亚洲研究院视觉计算组提出的具备建模几何形变的卷积神经网络。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/38445d4f40043aae3446807ebb783446.jpeg)
代码:https://github.com/msracver/Deformable-ConvNets
论文:https://arxiv.org/abs/1703.06211https://arxiv.org/abs/1811.11168
3. Relation networks
微软亚洲研究院视觉计算组提出的利用物体之间的关联来提高物体检测器的性能。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/91af10a0d714c8b51ab8eb3dd33e7478.jpeg)
代码:https://github.com/msracver/Relation-Networks-for-Object-Detection
论文:https://arxiv.org/pdf/1711.11575.pdf
语义和实例分割
1. HRNet-Semantic-Segmentation
微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了语义分割的性能。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/6e9e349e799055b4cdf11d715f26d7ba.jpeg)
代码:https://github.com/HRNet/HRNet-Semantic-Segmentationhttps://github.com/HRNet/HRNet-MaskRCNN-Benchmark
论文:https://arxiv.org/pdf/1904.04514.pdf
2. Fully convolutional instance-aware semantic segmentation
微软亚洲研究院视觉计算组提出的端到端的实例分割的系统,整体设计是基于全卷积网络,在COCO2016比赛中获得了冠军。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/755a80331a6b6d3feb2bd8d7902e0b9d.jpeg)
代码:https://github.com/msracver/FCIS
论文:https://arxiv.org/pdf/1611.07709.pdf
人体姿态估计
1. HRNet-Human-Pose-Estimation
微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人体关键点热图空间的精准度。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/2a36ed55e834fc105a2c2e7ec50f69b9.jpeg)
代码:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch
论文:https://arxiv.org/pdf/1902.09212.pdf
2. SimplePose
微软亚洲研究院视觉计算组提出的一种用于检测人体的关键点任务的网络结构,简单有效。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/be2385eb0d60bf07a70a5e8f236171e5.jpeg)
代码:https://github.com/Microsoft/human-pose-estimation.pytorch
论文:https://arxiv.org/abs/1804.06208
3. Integral human pose regression
微软亚洲研究院视觉计算组提出了一种积分操作来处理3D人体姿态估计任务中的后处理/量化不可求导的问题。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/1e025f2a1979eb4e611f7f13f3b0524e.jpeg)
代码:https://github.com/JimmySuen/integral-human-pose
论文:https://arxiv.org/abs/1711.08229
人脸对齐
1. HRNet-Facial-Landmark-Detection
微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人脸关键点检测的性能。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/6e9e349e799055b4cdf11d715f26d7ba.jpeg)
代码:https://github.com/HRNet/HRNet-Facial-Landmark-Detection
论文:https://arxiv.org/pdf/1904.04514.pdf
高效和轻量级卷积神经网络结构设计
1. HRNet-Classification
微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到多分辨率表征,然后组合多分辨率表征来做图像识别。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/0717796476b50e4bf88d6ada584e4b46.jpeg)
代码:https://github.com/HRNet/HRNet-Image-Classification
论文:https://arxiv.org/pdf/1904.04514.pdf
2. Interleaved group convolutions
微软亚洲研究院视觉计算组提出的一种轻量级的网络结构,在分类检测等任务上都取得了比谷歌的MobileNetv2更好的结果。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/8f91f9ee2e6b37c3cd1b1ae09edaa039.jpeg)
代码:https://github.com/homles11/IGCV3
论文:https://arxiv.org/pdf/1707.02725.pdfhttps://arxiv.org/pdf/1804.06202.pdfhttps://arxiv.org/pdf/1806.00178.pdf
行人再识别
1. Deeply-learned part-aligned representations
微软亚洲研究院视觉计算组提出的利用人体部位信息来提取行人表征。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/4290577df37eaaab640534ec1364674a.jpeg)
代码:https://github.com/zlmzju/part_reid
论文:http://openaccess.thecvf.com/content_ICCV_2017/papers/Zhao_Deeply-Learned_Part-Aligned_Representations_ICCV_2017_paper.pdf
2. Part-aligned bilinear representations
微软亚洲研究院视觉计算组提出一种利用双线性池化来组合人体姿态以提取行人表征。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/95c7098d43cda8d872dfe7809a83a61d.jpeg)
代码:https://github.com/yuminsuh/part_bilinear_reid
论文:http://openaccess.thecvf.com/content_ECCV_2018/papers/Yumin_Suh_Part-Aligned_Bilinear_Representations_ECCV_2018_paper.pdf
视频目标检测
1. Deep feature low
微软亚洲研究院视觉计算组提出的视频理解的网络结构,通过利用视频之间的光流信息来传递相邻帧之间的预测。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/39ddfb1a4eec086af00bb9ee48f3ef0a.jpeg)
代码:https://github.com/msracver/Deep-Feature-Flow
论文:https://arxiv.org/abs/1611.07715
2. Flow-guided feature aggregation
微软亚洲研究院视觉计算组提出的解决视频中物体检测问题的框架,利用光流在帮助组合相邻帧的表征。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/b3fd59e8760bc8c2d01bd127f8dd092e.jpeg)
代码:https://github.com/msracver/Flow-Guided-Feature-Aggregation
论文:https://arxiv.org/pdf/1703.10025.pdf
目标跟踪
1. Deeper and wider Siamese networks
微软亚洲研究院多媒体搜索和挖掘组提出的更深更宽的孪生网络来解决目标跟踪问题。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/025c520374cc2ada211abfc4a5095d30.jpeg)
代码:https://github.com/researchmm/SiamDW
论文:https://arxiv.org/abs/1901.01660
最近邻搜索
1. SPTAG
微软亚洲研究院系统组与微软必应组共同推出的一个可以处理上亿数据的索引建立以及搜索系统,已经用在微软必应产品里。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/0427d2909fa8e0706d6bc23cdc282c53.jpeg)
代码:https://github.com/Microsoft/SPTAG
论文:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.862.7975&rep=rep1&type=pdfhttp://pages.ucsd.edu/~ztu/publication/cvpr12_knnG.pdf, https://ieeexplore.ieee.org/iel7/34/4359286/06549106.pdf
2. Composite quantization
微软亚洲研究院视觉计算组提出的一种高效的紧致编码(哈希)算法。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/c4575cfbf85c99fce15674d4d80755cf.jpeg)
代码:https://github.com/hellozting/CompositeQuantization
论文:http://proceedings.mlr.press/v32/zhangd14.pdf
更多内容大家可以通过点击“阅读原文”跳转过去查看更多好玩的项目,当然也欢迎小伙伴分享你了解到的一些项目
交流群
扫码添加助手,可申请加入AI_study交流群。一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡西),不根据格式申请,一律不通过。
【目前已有众多知名高校学生和从业者在群里面学习成长,期待你的加入】
推荐阅读:
史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)
你点的每个“在看”,我都认真当成了喜欢