ICCV 2023 获奖论文在研究什么？

最新推荐文章于 2024-07-20 17:44:03 发布

我爱计算机视觉

最新推荐文章于 2024-07-20 17:44:03 发布

阅读量265

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247617669&idx=1&sn=6e686c20953c9667aca415a1830c4caa&chksm=96f17ed1a186f7c7081333bd72f1c1fa9dc4e72dbfbf040b4c480608269c0b05ff278e9f3743&scene=126&sessionid=0

版权

顶级CV盛会

ICCV（International Conference on Computer Vision）作为全球计算机视觉领域顶级的学术会议，每两年召开一次，今年在法国巴黎召开。

ICCV 2023 投稿总数达 8068 篇，其中 2160 篇被接收，录用率为 26.8%。不少重量级成果在还未开会前就引起大量关注，比如大名鼎鼎的分割一切模型。

使用趋动云的很多小伙伴在从事CV领域研究，ICCV成为近期社区讨论的热点。本文将带领大家一览今年的获奖论文，希望对大家做研究有启发！

获奖论文一览

最佳论文奖——马尔奖

共有两篇。

1.Adding Conditional Control to Text-to-Image Diffusion Models

论文地址：https://arxiv.org/pdf/2302.05543.pdf
开源地址：https://github.com/lllyasviel/ControlNet （该项目已有2.4万stars）
作者单位：斯坦福大学

这篇论文研究内容是为扩散模型（如 Stable Diffusion）添加额外的条件控制，核心思想是在文本描述之外添加一些额外条件来控制扩散模型（如 Stable Diffusion），从而更好地控制生成图像的人物姿态、深度、画面结构等信息。

2.Passive Ultra-Wideband Single-Photon Imaging

论文地址：https://appleswithacapitala.github.io/static/docs/paper.pdf
项目地址：https://appleswithacapitala.github.io/
作者单位：多伦多大学

研究内容是关于如何同时以极端不同的时间尺度（从秒到皮秒） passively（即不主动发光）对动态场景进行成像。研究着重于使用单光子相位检测器(SPAD)进行成像，但传统的光子流估计技术在这种极端条件下无法正常工作。研究内容包括开发一种光子流探测理论，利用随机微积分的见解，从光子检测时间戳流中重建像素的时变光子流，以及推导出一种新颖的傅立叶域光子流重建算法。研究还展示了这种异步成像方法的潜力，包括无需同步的情况下成像不同速度的光源，被称为被动非直线的视野视频采集，以及记录超宽带视频，可回放以显示日常运动或以极慢速度播放以显示光的传播。

最佳论文奖提名

Segment Anything

论文地址：https://arxiv.org/pdf/2304.02643.pdf
项目地址：https://segment-anything.com/
作者单位：Meta AI

备受关注的“分割一切”项目，旨在通过使用提示等方式实现零样本迁移到新的图像分布和任务上，实现对任何对象的分割。作者分享了相关模型和构建的数据集，CV研究社区的一大热门话题，目前基于该项目和数据的研究工作还在不断被推出。

最佳学生论文奖

Tracking Everything Everywhere All at Once

论文地址：https://browse.arxiv.org/pdf/2306.05422.pdf
开源地址：https://github.com/qianqianwang68/omnimotion
作者单位：Cornell University，Google Research，UC Berkeley

看标题，和Segment Anything有异曲同工之妙。

研究内容是关于一种用于估计视频中密集和远程运动的新的测试时优化方法。该方法提出了一种全面且全局一致的运动表示方式，称为OmniMotion，可用于准确估计视频中每个像素的完整运动轨迹，包括处理遮挡、维持全局一致性，以及建模相机和物体运动。

趋动云助力CV科研

趋动云作为领先的GPU云服务商，专注于为AI研究开发者提供强大的计算资源和全面的支持。对于计算机视觉研究人员具有独特的优势，助力科研成功。

强大的GPU计算资源：趋动云平台有大量高算力、大内存、大显存实例，研究者可以在趋动云的平台上运行复杂的深度学习模型，加快实验进程，提高研究效率。
灵活的资源配置：趋动云允许用户根据其研究需求灵活配置计算资源。无论是小规模的实验还是大规模的模型训练，用户都可以根据需要选择合适的GPU数量和内存大小，以确保资源的最佳利用，节省成本。
多样化的软件配置方案：相比于本地主机一套机器一套软件的方案，趋动云提供用户多样化的操作系统和软件配置镜像方案，资源配置时一键点击即可使用，以最大可能降低用户在软件版本等方面需要付出的不必要的时间成本。
丰富的数据和模型存储服务：趋动云平台已经有700+数据集、模型，使用这些数据和模型，无需上传到平台，一键选择即可使用，大大节省用户上传数据集的时间，CV领域常见数据集如COCO等均已支持，对于目前比较火热的大数据集项目、大模型项目研究特别友好。
安全和可靠性：趋动云致力于保护用户数据的安全性和隐私，并提供可靠的服务。数据加密、备份和恢复机制确保用户的研究数据始终得到充分的保护。

总之，趋动云作为一家GPU云服务商，为计算机视觉研究者提供了强大的工具和资源，帮助他们加速研究进程、优化模型性能，取得更大的研究成果。无论是学术研究还是商业应用，趋动云都是计算机视觉领域研究者的理想合作伙伴。

趋动云

连接算力・连接人

注册即可获得 168 元体验金！https://growthdata.virtaicloud.com/t/Va