【ECCV 2024】InternVideo2: Scaling Foundation Models for Multimodal Video Understanding

最新推荐文章于 2025-05-14 10:05:25 发布

旋转的油纸伞

最新推荐文章于 2025-05-14 10:05:25 发布

阅读量1.8k

点赞数 16

分类专栏：视频生成/视频理解 cv与nlp深度学习实战项目【知识总结与代码】文章标签： InternVideo InternVideo2 vid transformer 深度学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45934285/article/details/140841366

版权

cv与nlp深度学习实战项目【知识总结与代码】同时被 2 个专栏收录

22 篇文章 ¥9.90 ¥99.00

订阅专栏

视频生成/视频理解

9 篇文章 ¥9.90 ¥99.00

订阅专栏

【ECCV 2024】InternVideo2: Scaling Foundation Models for Multimodal Video Understanding

一、前言
Abstract
1 Introduction
2 Related Work
3 Method
4 Multimodal Video Data
5 Experiments
6 Conclusion and Discussion
7 Broader Impact

一、前言

Authors: Yi Wang, Kunchang Li, Xinhao Li, Jiashuo Yu, Yinan He, Chenting Wang, Guo Chen, Baoqi Pei, Ziang Yan, Rongkun Zheng, Jilan Xu, Zun Wang, Yansong Shi, Tianxiang Jiang, Songze Li, Hongjie Zhang, Yifei Huang, Yu Qiao, Yali Wang, Limin Wang
单位：OpenGVLab, Shanghai AI Laboratory

【Paper】 > 【Github_Code】 > 【Project】

Abstract

介绍：我们推出了 InternVideo2，这是一个新的视频基础模型 (ViFM)

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

旋转的油纸伞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。