自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(26)
  • 收藏
  • 关注

原创 CV最新论文|4月10日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月10日 arXiv 计算机视觉和模式识别相关论文:1、InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4K HDInternLM-XComposer2-4KHD:一种开创性的大型视觉语言模型,可处理从 336 像素到 4K 高清的分辨率摘要:大型视觉语言模型 (LVLM) 领域取得了重大进展

2024-04-10 15:17:50 1113

原创 CV最新论文|4月9日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月9日 arXiv 计算机视觉和模式识别相关论文:1、Finding Visual Task Vectors查找可视化任务向量摘要:视觉提示是一种通过上下文示例教模型执行视觉任务的技术,无需任何额外的训练。在这项工作中,我们分析了MAE-VQGAN(一种最近的视觉提示模型)的激活,并找到了任务向量,即编码特定于任务的信息的激活。有了这种洞察力,我们证明了可以识别任务向量并使用它们来指导网络执行不同的任务,而无需提供任何输入输出示例。为了找到任务向量,我们计

2024-04-09 11:25:20 431

原创 CV最新论文|4月8日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月8日 arXiv 计算机视觉和模式识别相关论文:1、Sigma: Siamese Mamba Network for Multi-Modal Semantic SegmentationSigma:用于多模态语义分割的暹罗曼巴网络摘要:多模态语义分割显著增强了 AI 智能体的感知和场景理解,尤其是在弱光或过度曝光环境等不利条件下。利用其他模态(X模态)以及传统的RGB热敏和深度,可提供互补信息,从而实现更强大、更可靠的分割。在这项工作中,我们介绍了Sigm

2024-04-08 14:26:38 1382

原创 CV最新论文|4月5日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月5日 arXiv 计算机视觉和模式识别相关论文:1、Know Your Neighbors: Improving Single-View Reconstruction via Spatial Vision-Language Reasoning了解你的邻居:通过空间视觉-语言推理改进单视图重建摘要:从单个视图恢复 3D 场景几何体是计算机视觉中一个基本但不恰当的问题。虽然经典的深度估计方法只能推断出局限于图像平面的 2.5D 场景表示,但最近基于辐射场的方

2024-04-07 14:01:01 727

原创 CV最新论文|4月3日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月3日 arXiv 计算机视觉和模式识别相关论文:1、Segment Any 3D Object with Language使用语言分割任何 3D 对象摘要:在本文中,我们研究了具有自由格式语言指令的开放词汇 3D 实例分割 (OV-3DIS)。早期的作品仅依靠带注释的基本类别进行训练,对看不见的新类别的泛化有限。最近的工作通过生成与类别无关的掩码或将广义掩码从 2D 投影到 3D 来缓解对新类别的较差泛化性,但忽略了语义或几何信息,导致性能欠佳。相反,直

2024-04-03 10:50:31 627

原创 CV最新论文|4月2日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月2日 arXiv 计算机视觉和模式识别相关论文:1、NeRF-MAE : Masked AutoEncoders for Self Supervised 3D representation Learning for Neural Radiance FieldsNeRF-MAE:用于神经辐射场的自监督 3D 表示学习的屏蔽自动编码器摘要:神经场在计算机视觉和机器人技术中表现出色,因为它们能够理解 3D 视觉世界,例如推断语义、几何和动力学。鉴于神经场在从

2024-04-02 14:52:21 749

原创 CV最新论文|4月1日 arXiv更新论文合集

以下内容由马拉AI整理,今天为大家带来4月1日 arXiv 计算机视觉和模式识别相关论文:1、Unsolvable Problem Detection: Evaluating Trustworthiness of Vision Language Models无法解决的问题检测:评估视觉语言模型的可信度摘要:本文介绍了视觉语言模型 (VLM) 面临的一个新颖而重大的挑战,称为不可解决的问题检测 (UPD)。UPD 检查 VLM 在视觉问答 (VQA) 任务中面临无法解决的问题时拒绝回答的能力。UP

2024-04-01 13:43:59 1221 1

原创 CV最新论文|3月29日 arXiv更新论文合集

CV最新论文|3月29日 arXiv更新论文合集

2024-03-29 15:18:23 831 1

原创 CV最新论文|3月28日 arXiv更新论文合集

计算机视觉

2024-03-28 14:00:03 1020

原创 CV最新论文|3月26日 arXiv更新论文合集

计算机视觉

2024-03-26 14:32:15 869

原创 CV最新论文|3月25日 arXiv更新论文合集

计算机视觉

2024-03-25 14:13:45 964

转载 ICCV 2023 | 3DPPE:用于环视3D目标检测的3D点编码

第一次看到PETR的时候,感叹作者的认知面的广泛,可以把类似于NERF中的思路迁移过来做3D检测,通过给每个单目2D图像特征赋予一个独立的含有3D信息的位置编码(如图1.a),实现在3D空间中交互索引2D图像特征。但是PETR中含有3D信息的位置编码的机理是什么,含有的3D信息又是啥,一开始还不是很确定,于是我们设计了一系列的实验,来探索3D目标检测中图像特征不同位置编码的影响。公司简介:后摩智能,刚刚推出国内首款量产存算一体智驾芯片,最高物理算力256TOPS,典型功耗35W。

2023-08-01 12:30:45 354 1

原创 ICCV 2023 | 论文及代码合集

近日,世界三大顶级视觉会议之一ICCV公开了最新录用结果。根据文件里给出的ID,总共有2160篇论文入选。我们整理了部分录用论文及其代码合集(持续更新…

2023-07-18 11:34:33 3402 3

原创 KDD 2023 | 先睹为快!KDD 2023论文合集50篇(附下载地址)

Area:基于通用语言模型 (GLM) 的网络增强型问答系统。Area:一种用于股票趋势预测增量学习的元学习方法。Area:位置之间的多时态关系推断、图学习。Area:提示学习少样本文本分类。Area:图上的聚类加速表示学习。Area:半监督图不平衡回归。Area:类不平衡节点分类。Area:多模态联邦学习。Area:小样本节点分类。Area:工业推荐系统。Area:外卖推荐系统。Area:会话推荐系统。Area:图对比学习。Area:弱监督学习。Area:图神经网络。Area:假新闻检测。

2023-06-20 12:15:51 2890

原创 ICML2023 | 论文分方向合集

4月,ICML公布了今年录取情况,共有6538份论文提交,1827篇论文被接收,录用率27.9%。我们整理部分ICML 2023的论文合集,按方向分类整理如下,需要的同学可跳转。

2023-06-15 11:12:53 2072

原创 CVPR 2023 | 一文看尽12篇Best Paper候选(附合集)

CVPR 2023 Best Paper

2023-06-14 14:23:17 4489

原创 CVPR2023 | 神经网络结构设计、CNN、GNN、Transformer论文合集(附代码)

合集下载[1]Boundary Unlearning[Code]

2023-05-12 19:00:12 1504

原创 CVPR2023 | 三维视觉方向论文合集(附代码)

本合集包含三维重建、点云、场景重建/视图合成/新视角合成等细分任务。

2023-05-09 14:14:23 2391

原创 时间序列2023 | 时序预测/分析/建模/检测…论文合集(附代码)

最新时间序列相关论文合集。

2023-05-08 14:50:11 1680

原创 SAM | 分割一切相关论文45篇合集(附代码)

SAM分割一切论文合集

2023-05-05 18:21:12 394 1

原创 CVPR2023 | 70+目标检测论文及代码整理

CVPR2023目标检测相关70+论文及代码整理

2023-04-28 15:47:49 13452 1

原创 医学图像数据集

医学图像数据集

2023-04-25 12:58:11 924 1

原创 知识蒸馏(Knowledge distillation)必读论文合集

知识蒸馏

2023-04-19 16:29:48 861 1

原创 Kaggle多目标推荐比赛baseline

以下内容由马拉AI提供。

2023-04-14 15:49:37 378 1

转载 CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻

Meta 表示,他们受到语言模型中提示的启发,因而其训练完成的 SAM 可以为任何提示返回有效的分割掩码,其中提示可以是前景、背景点、粗框或掩码、自由格式文本,或者说能指示图像中要分割内容的任何信息。SA-1B 的图像来自跨不同地理区域和收入水平的多个国家或地区的照片提供者,在拥有更多图像的同时对所有地区的总体代表性也更好。与之前的大规模分割数据收集工作相比,Meta 的方法比 COCO 完全手动基于多边形的掩码注释快 6.5 倍,比之前最大的数据注释工作快 2 倍,这是因为有了 SAM 模型辅助的结果。

2023-04-07 16:59:26 173 1

原创 CVPR2023论文及代码合集来啦~

80、半监督学习、弱监督学习/无监督学习/自监督学习。36、行为识别/动作识别/检测/分割/定位。46、场景重建/视图合成/新视角合成。74、迁移学习/domain/自适应。23、图像复原/图像增强/图像重建。26、图像去噪/去模糊/去雨去雾。32、人脸生成/合成/重建/编辑。35、图像&视频检索/视频理解。41、GAN/生成式/对抗式。68、小样本学习/零样本学习。40、文本检测/识别/理解。17、视频生成/视频合成。27、图像编辑/图像修复。​31、人脸识别/检测。42、图像生成/图像合成。

2023-04-04 12:54:01 10414 17

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除