公众号内容拓展学习笔记(2021.10.16)
📎 今日要点
-
ICCV 2021 | 字节跳动利用单幅图片做三维重建!将NeRF、MPI结合,提出MINE新工作 ⭐️⭐️
- Abstract: 一种新的三维空间表达方式 MINE利用单幅图片做三维重建
- Paper: MINE: Towards Continuous Depth MPI with NeRF for Novel View Synthesis
- Code: https://github.com/vincentfung13/MINE
- Tips: 相比于 MPI 和 NeRF,MINE具有很大的优势。
-
浙大三维视觉团队提出Animatable NeRF,从RGB视频中重建可驱动人体模型 (ICCV’21) ⭐️⭐️
- Abstract: 浙大三维视觉团队提出Animatable NeRF,从RGB视频中重建可驱动人体模型
- Paper: Animatable Neural Radiance Fields for Modeling Dynamic Human Bodies
- Code: https://github.com/zju3dv/animatable_nerf
- Tips: 当人体模型训练完成后,可以用新的人体骨架进行驱动
-
CVPR2021 用更好的目标检测器提取视觉特征!微软提出VinVL,基于更好的视觉特征,达到更强的多模态性能 ⭐️⭐️
- Abstract: 微软提出VinVL,基于更好的视觉特征,达到更强的多模态性能
- Paper: VinVL: Revisiting Visual Representations in Vision-Language Models
- Code: https://github.com/pzzhang/VinVL
- Tips: 作者将新的目标检测模型生成的视觉特征输入到基于Transformer的VL融合模型OSCAR中
-
全新instruction调优,零样本性能超越小样本,谷歌1370亿参数新模型比GPT-3更强 ⭐️⭐️
- Abstract: 全新instruction调优,零样本性能超越小样本,谷歌1370亿参数新模型比GPT-3更强
- Paper: FINETUNED LANGUAGE MODELS ARE ZERO-SHOT LEARNERS
- Code: https://github.com/google-research/flan
- Tips: FLAN采用指令调整技术后的模型在自然语言推理、阅读理解和开放域问答等未见过的任务上的零样本性能超越了 GPT-3 的小样本性能。
-
“推荐算法”最新工作,一次让你看个够! ⭐️⭐️
- Abstract: 推荐系统最新工作
- Tips: 8篇有关推荐系统最新工作的总结。
-
视频理解综述:动作识别、时序动作定位、视频Embedding ⭐️⭐️
- Abstract: 视频理解综述:动作识别、时序动作定位、视频Embedding
- Tips: 本文将介绍视频理解中的三大基础领域:动作识别(Action Recognition)、时序动作定位(Temporal Action Localization)和视频 Embedding