有什么推荐的计算机视觉项目？来自微软亚研院的清单

最新推荐文章于 2024-06-13 10:01:41 发布

我爱计算机视觉

最新推荐文章于 2024-06-13 10:01:41 发布

阅读量404

点赞数

点击我爱计算机视觉标星，更快获取CVML新技术

微软亚洲研究院产出了很多计算机视觉黑科技，也有大量关注度极高的高质量开源项目，对于热爱CV的同学来说，以下这波推荐不容错过。

另外文末52CV举办“CV项目推荐赢红包”的活动，欢迎参加。

作者：微软亚洲研究院
链接：https://www.zhihu.com/question/320330671/answer/738260594
来源：知乎，已获作者授权转载，禁止二次转载。

我们邀请了微软亚洲研究院视觉计算组资深研究员王井东博士和研究员元玉慧博士为大家推荐来自微软亚洲研究院众多项目，共分为目标检测、语义和实例分割、人体姿态估计、人脸对齐、高效和轻量级卷积神经网络结构设计、行人再识别、视频目标检测、目标跟踪、最近邻搜索等领域。

目标检测

1. HRNet-Object-Detection

微软亚洲研究院视觉计算组提出的一种新型主干网络结构，可以学到高分辨率表征，提高了目标特别是小目标检测的空间精准率。支持multi-scale sync-bn 训练。

代码：

https://github.com/HRNet/HRNet-Object-Detection
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark
https://github.com/HRNet/HRNet-FCOS

论文：

https://arxiv.org/pdf/1904.04514.pdf

2. Deformable convolutional networks

微软亚洲研究院视觉计算组提出的具备建模几何形变的卷积神经网络。

代码：

https://github.com/msracver/Deformable-ConvNets

论文：

https://arxiv.org/abs/1703.06211
https://arxiv.org/abs/1811.11168

3. Relation networks

微软亚洲研究院视觉计算组提出的利用物体之间的关联来提高物体检测器的性能。

代码：

https://github.com/msracver/Relation-Networks-for-Object-Detection

论文：

https://arxiv.org/pdf/1711.11575.pdf

语义和实例分割

1. HRNet-Semantic-Segmentation

微软亚洲研究院视觉计算组提出的一种新型主干网络结构，可以学到高分辨率表征，有效的提高了语义分割的性能。

代码：

https://github.com/HRNet/HRNet-Semantic-Segmentation
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark

论文：

https://arxiv.org/pdf/1904.04514.pdf

2. Fully convolutional instance-aware semantic segmentation

微软亚洲研究院视觉计算组提出的端到端的实例分割的系统，整体设计是基于全卷积网络，在COCO2016比赛中获得了冠军。

代码：

https://github.com/msracver/FCIS

论文：

https://arxiv.org/pdf/1611.07709.pdf

人体姿态估计

1. HRNet-Human-Pose-Estimation

微软亚洲研究院视觉计算组提出的一种新型主干网络结构，可以学到高分辨率表征，有效的提高了人体关键点热图空间的精准度。

代码：

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

论文：

https://arxiv.org/pdf/1902.09212.pdf

2. SimplePose

微软亚洲研究院视觉计算组提出的一种用于检测人体的关键点任务的网络结构，简单有效。

代码：

https://github.com/Microsoft/human-pose-estimation.pytorch

论文：

https://arxiv.org/abs/1804.06208

3. Integral human pose regression

微软亚洲研究院视觉计算组提出了一种积分操作来处理3D人体姿态估计任务中的后处理/量化不可求导的问题。

代码：

https://github.com/JimmySuen/integral-human-pose

论文：

https://arxiv.org/abs/1711.08229

人脸对齐

1. HRNet-Facial-Landmark-Detection

微软亚洲研究院视觉计算组提出的一种新型主干网络结构，可以学到高分辨率表征，有效的提高了人脸关键点检测的性能。

代码：

https://github.com/HRNet/HRNet-Facial-Landmark-Detection

论文：

https://arxiv.org/pdf/1904.04514.pdf

高效和轻量级卷积神经网络结构设计

1. HRNet-Classification

微软亚洲研究院视觉计算组提出的一种新型主干网络结构，可以学到多分辨率表征，然后组合多分辨率表征来做图像识别。

代码：

https://github.com/HRNet/HRNet-Image-Classification

论文：

https://arxiv.org/pdf/1904.04514.pdf

2. Interleaved group convolutions

微软亚洲研究院视觉计算组提出的一种轻量级的网络结构，在分类检测等任务上都取得了比谷歌的MobileNetv2更好的结果。

代码：

https://github.com/homles11/IGCV3

论文：

https://arxiv.org/pdf/1707.02725.pdf
https://arxiv.org/pdf/1804.06202.pdf
https://arxiv.org/pdf/1806.00178.pdf

行人再识别

1. Deeply-learned part-aligned representations

微软亚洲研究院视觉计算组提出的利用人体部位信息来提取行人表征。

代码：

https://github.com/zlmzju/part_reid

论文：

http://openaccess.thecvf.com/content_ICCV_2017/papers/Zhao_Deeply-Learned_Part-Aligned_Representations_ICCV_2017_paper.pdf

2. Part-aligned bilinear representations

微软亚洲研究院视觉计算组提出一种利用双线性池化来组合人体姿态以提取行人表征。

代码：

https://github.com/yuminsuh/part_bilinear_reid

论文：

http://openaccess.thecvf.com/content_ECCV_2018/papers/Yumin_Suh_Part-Aligned_Bilinear_Representations_ECCV_2018_paper.pdf

视频目标检测

1. Deep feature low

微软亚洲研究院视觉计算组提出的视频理解的网络结构，通过利用视频之间的光流信息来传递相邻帧之间的预测。

代码：

https://github.com/msracver/Deep-Feature-Flow

论文：

https://arxiv.org/abs/1611.07715

2. Flow-guided feature aggregation

微软亚洲研究院视觉计算组提出的解决视频中物体检测问题的框架，利用光流在帮助组合相邻帧的表征。

代码：

https://github.com/msracver/Flow-Guided-Feature-Aggregation

论文：

https://arxiv.org/pdf/1703.10025.pdf

目标跟踪

1. Deeper and wider Siamese networks

微软亚洲研究院多媒体搜索和挖掘组提出的更深更宽的孪生网络来解决目标跟踪问题。

代码：

https://github.com/researchmm/SiamDW

论文：

https://arxiv.org/abs/1901.01660

最近邻搜索

1. SPTAG

微软亚洲研究院系统组与微软必应组共同推出的一个可以处理上亿数据的索引建立以及搜索系统，已经用在微软必应产品里。

代码：

https://github.com/Microsoft/SPTAG

论文：

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.862.7975&rep=rep1&type=pdf
http://pages.ucsd.edu/~ztu/publication/cvpr12_knnG.pdf，

https://ieeexplore.ieee.org/iel7/34/4359286/06549106.pdf

2. Composite quantization

微软亚洲研究院视觉计算组提出的一种高效的紧致编码（哈希）算法。

代码：

https://github.com/hellozting/CompositeQuantization

论文：

http://proceedings.mlr.press/v32/zhangd14.pdf

CV项目推荐活动

欢迎大家文末留言推荐高质量的CV开源项目，截止到8月19号12点，点赞最高的开源项目推荐者，CV君将发50元红包。

留言需包含项目简介与开源地址，如：

项目简介：

Face Analysis Project on MXNet

地址：

https://github.com/deepinsight/insightface

ps.所有52CV粉丝均可参与推荐，但为防止羊毛党刷赞，该活动获奖用户仅限8月16日之前关注的粉丝，如点赞第前几名不符合条件，则名额顺延，谢谢理解。

CV细分方向交流群

52CV已经建立多个CV专业交流群，包括：目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等，扫码添加CV君拉你入群，

（请务必注明相关方向，比如：目标检测）

喜欢在QQ交流的童鞋，可以加52CV官方QQ群：805388940。

（不会时时在线，如果没能及时通过验证还请见谅

长按关注我爱计算机视觉

我爱计算机视觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
有什么推荐的计算机视觉项目？来自微软亚研院的清单

点击我爱计算机视觉标星，更快获取CVML新技术微软亚洲研究院产出了很多计算机视觉黑科技，也有大量关注度极高的高质量开源项目，对于热爱CV的同学来说，以下这波推荐不容错过。另外文末52CV...
复制链接

扫一扫