小白学视觉
码龄6年
关注
提问 私信
  • 博客:6,025,439
    社区:5,754
    视频:34
    6,031,227
    总访问量
  • 638
    原创
  • 498
    排名
  • 8,931
    粉丝
  • 学习成就

个人简介:跟着小白一起学视觉

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:辽宁省
  • 加入CSDN时间: 2018-07-17
博客简介:

小白学视觉

查看详细资料
  • 原力等级
    成就
    当前等级
    8
    当前总分
    4,893
    当月
    171
个人成就
  • 获得5,894次点赞
  • 内容获得904次评论
  • 获得43,347次收藏
  • 代码片获得52,194次分享
创作历程
  • 899篇
    2024年
  • 1053篇
    2023年
  • 1178篇
    2022年
  • 1395篇
    2021年
  • 148篇
    2020年
  • 10篇
    2019年
  • 6篇
    2018年
成就勋章
TA的专栏
  • 论文解读 IEEE TPAMI
    付费
    303篇
  • 图像处理顶刊解读
    2篇
  • 论文解读
    33篇
  • OpenCV视觉实战项目
    22篇
  • OpenCV 4开发详解
    62篇
TA的推广
兴趣领域 设置
  • 人工智能
    opencv计算机视觉深度学习神经网络pytorch图像处理
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

182人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

TPAMI 2024 | 广义线性因果网络的联邦学习

题目:Federated Learning of Generalized Linear Causal Networks广义线性因果网络的联邦学习作者:Qiaoling Ye; Arash A. Amini; Qing Zhou摘要因果发现,即从数据中推断变量之间的因果关系,是科学中的一个基本问题。如今,由于对数据隐私问题的日益关注,分布式数据收集、处理和存储发生了转变。为了满足分布式因果发现的迫切需求,我们提出了一种新的联合有向无环图(DAG)学习方法,称为分布式退火正则化似然分数(DARLS),
原创
发布博客 11 小时前 ·
11 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | 面向对未知对抗性攻击具有泛化鲁棒性的元不变性防御

尽管为计算机视觉任务提供了高性能的解决方案,但深度神经网络(DNN)模型已被证明极易受到对抗性攻击的影响。当前的防御主要集中在已知攻击上,但对未知攻击的对抗性鲁棒性却严重被忽视。此外,常用的自适应学习和微调技术在对抗性防御中不适用,因为在部署时本质上是一个零样本问题。因此,为了应对这一挑战,我们提出了一种名为Meta Invariance Defense(MID)的攻击不可知防御方法。
原创
发布博客 11 小时前 ·
8 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | MO-MIX:基于深度强化学习的多目标多智能体协同决策

深度强化学习(RL)已被广泛应用于解决复杂的决策问题。在许多现实世界的场景中,任务通常有多个相互冲突的目标,并且可能需要多个智能体进行合作,这些是多目标多智能体决策问题。然而,在这个交叉领域的研究工作还相对较少。现有的方法仅限于单独的领域,并且只能处理具有单一目标的多智能体决策,或者具有单一智能体的多目标决策。在本文中,我们提出了MO-MIX来解决多目标多智能体强化学习(MOMARL)问题。我们的方法基于集中训练与分散执行(CTDE)框架。
原创
发布博客 昨天 09:30 ·
116 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | 用于主动目标检测的多实例差异化学习

尽管图像识别的主动学习取得了实质性进展,但缺乏对目标检测中实例级主动学习的系统研究。在本文中,我们提出了一种将实例不确定性计算与图像不确定性估计统一起来的方法,用于信息图像选择,创建了一种用于实例级主动学习的多实例差异化学习(MIDL)方法。MIDL包括一个分类器预测差异化模块和一个多实例差异化模块。前者利用两个对抗性实例分类器在标记集和未标记集上进行训练,以估计未标记集的实例不确定性。后者将未标记图像视为实例包,并使用多实例学习方式中的实例分类模型重新估计图像-实例不确定性。
原创
发布博客 昨天 09:30 ·
230 阅读 ·
6 点赞 ·
0 评论 ·
0 收藏

顶刊解读 TRGS | 位置-时间感知Transformer用于遥感变化检测

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达A Position-Temporal Awareness Transformer for Remote Sensing Change Detection位置-时间感知Transformer用于遥感变化检测作者:Yikun Liu, Kuikui Wang, Mingsong Li, Yuwen Huang, Gongping ...
转载
发布博客 前天 10:05 ·
13 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | STMixer: 一种单阶段稀疏动作检测器

我们将动作查询以解耦的方式定义。具体来说,我们将动作查询分解为空间查询Qs∈RN×L×DQs​∈RN×L×D、位置查询Qp∈RN×L×4Qp​∈RN×L×4和时间查询Qt∈RN×DQt​∈RN×D。N代表查询的数量,而D表示每个查询的维度。L代表输出框的时间长度。对于关键帧动作检测,L1L = 1L1,因为它只需要在关键帧上预测动作框。对于动作管检测,LTL = TLT。
原创
发布博客 前天 09:30 ·
115 阅读 ·
5 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | 使用合成负样本的混合开放集分割

题目: Hybrid Open-Set Segmentation With Synthetic Negative Data使用合成负样本的混合开放集分割作者:Matej Grcic,Sinisa Segvic摘要开放集分割可以通过补充封闭集分类与异常检测来构想。许多现有的密集异常检测器通过生成模型对常规数据进行建模或与负数据进行区分。这两种方法优化了不同的目标,因此表现出不同的失败模式。因此,我们提出了一种新颖的异常得分,它融合了生成和判别的提示。我们的得分可以通过升级任何封闭集分割模型,以实现数据
原创
发布博客 前天 09:30 ·
109 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

Gemini 可以进行目标检测了!

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达我们对Gemini印象深刻的多模态能力已经很熟悉了,特别是在涉及图像数据推理时——无论是涉及图像描述、OCR、分类,还是识别图像中的特定内容。与其开放模型对应物PaliGemma不同,Gemini模型并没有明确针对目标检测任务进行训练。这一事实促使我进行一些实验并撰写这篇博客。PaliGemma链接:https://ai....
转载
发布博客 2024.11.10 ·
9 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

去他的顶会顶刊!我就想发个论文毕个业!

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达各位课题开拓者,你们是否经常挣扎在:毕业时间的紧迫:看着日历一天天翻过,毕业的日期越来越近,而论文的完成度却似乎停滞不前永不停歇的组会:导师每周要开组会,油尽灯枯毫无进展,没有内容可以分享无尽的调研报告:占用大量时间查找文献,给老板打工写毫无意义的调研报告毫不了解的前沿:无法阅读论文时间,辛苦想的idea,发现几年前已经发表面对...
转载
发布博客 2024.11.10 ·
20 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | DeepNet: 将Transformer扩展到1000层

— 在本文中,我们提出了一种简单而有效的方法来稳定极深的Transformer。具体来说,我们引入了一种新的归一化函数(DEEPNORM),用于修改Transformer中的残差连接,并伴随着理论上推导出的初始化。深入的理论分析表明,模型更新可以以稳定的方式被限制。所提出的方法结合了Post-LN的良好性能和Pre-LN的稳定训练这两个最佳方面,使DEEPNORM成为首选的替代方案。
原创
发布博客 2024.11.10 ·
13 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | PPDM++: 用于快速准确检测人-物交互的并行点检测与匹配

题目:PPDM++: Parallel Point Detection and Matching for Fast and Accurate HOI DetectionPPDM++: 用于快速准确检测人-物交互的并行点检测与匹配作者:Yue Liao, Si Liu, Yulu Gao, Aixi Zhang, Zhimin Li, Fei Wang, and Bo Li摘要人-物交互(HOI)检测旨在通过检测交互三元组来理解人类活动。先前的HOI检测方法采用两阶段实例驱动范式。然而,第一阶段生成的
原创
发布博客 2024.11.10 ·
18 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | 基于原型的语义分割

题目:Prototype-Based Semantic Segmentation基于原型的语义分割作者:Tianfei Zhou; Wenguan Wang摘要基于深度学习的语义分割解决方案在过去十年中取得了令人信服的结果。这些解决方案涵盖了不同的网络架构(基于FCN或基于注意力),以及各种掩码解码方案(基于参数化softmax或基于像素查询)。尽管存在分歧,但可以通过将softmax权重或查询向量解释为可学习的类原型,将它们归为统一的框架。基于这一原型视角,我们揭示了参数化分割模式中的固有局限性
原创
发布博客 2024.11.09 ·
24 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

TPAMI 2024 | PERF: 从单张全景图生成全景神经辐射场

神经辐射场(NeRF)在给定多视角图像时,在新视角合成任务上取得了显著进展。最近,一些研究尝试利用3D先验知识,从单张图像中训练NeRF。然而,它们主要关注有限视角且包含少量遮挡的情况,这大大限制了其在真实世界中的360度全景场景中的扩展性,尤其是在存在大面积遮挡时。在本文中,我们提出了PERF,一个从单张全景图训练全景神经辐射场的360度新视角合成框架。值得注意的是,PERF允许在复杂场景中进行3D漫游,而无需繁琐的图像收集。
原创
发布博客 2024.11.09 ·
15 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

EMF-former:一种用于医学图像分割的高效且内存友好的Transformer

点击下方“ReadingPapers”卡片,每天获取顶刊论文解读论文信息题目:EMF-former: An Efficient and Memory-Friendly Transformer for Medical Image SegmentationEMF-former:一种用于医学图像分割的高效且内存友好的Transformer作者:Zhaoquan Hao, Hongyan Quan, an...
转载
发布博客 2024.11.08 ·
19 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一位上海交大教授的深度学习五年研究总结

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:许志钦,上海交通大学,编辑:极市平台作者注记我是2017年11月开始接触深度学习,至今刚好五年。2019年10月入职上海交大,至今三年,刚好第一阶段考核。2022年8月19号,我在第一届中国机器学习与科学应用大会做大会报告,总结这五年的研究以及展望未来的方向。本文是该报告里关于理论方面的研究总结(做了一点扩展)。报告视频链...
转载
发布博客 2024.11.08 ·
23 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

图像特征提取与匹配技术

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:william链接:https://zhuanlan.zhihu.com/p/133301967文仅分享,侵删特征提取和匹配是许多计算机视觉应用中的一个重要任务,广泛运用在运动结构、图像检索、目标检测等领域。每个计算机视觉初学者最先了解的特征检测器几乎都是1988年发布的HARRIS。在之后的几十年时间内各种各样的特征检测...
转载
发布博客 2024.11.08 ·
51 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

招生信息 | 香港大学杜泓阳教授团队博士招生

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达实验室及导师介绍网络智能与计算生态系统实验室(NICE Lab)由杜泓阳教授领导,他在香港大学担任助理教授,并在南洋理工大学获得博士学位,曾在北京交通大学获得学士学位。NICE Lab 专注于人工智能与计算机网络的交叉领域,致力于推进下一代智能网络和分布式AI系统的发展。研究领域我们的研究主要涵盖以下两个方向:AI for N...
转载
发布博客 2024.11.07 ·
16 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

GASA-UNet:用于医学图像分割的全局轴向自注意力U-Net

点击下方“ReadingPapers”卡片,每天获取顶刊论文解读论文信息题目:GASA-UNet: Global Axial Self-Attention U-Net for 3D Medical Image SegmentationGASA-UNet:用于3D医学图像分割的全局轴向自注意力U-Net作者:Chengkun Sun,Russell Stevens Terry,Jiang Bian,...
转载
发布博客 2024.11.07 ·
26 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

多尺度注意力融合图网络在遥感建筑变化检测中的应用

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达Multiscale Attention Fusion Graph Network for Remote Sensing Building Change Detection多尺度注意力融合图网络在遥感建筑变化检测中的应用作者:Yu Shangguan , Jinjiang Li , Zheng Chen , Lu Ren , a...
转载
发布博客 2024.11.06 ·
26 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

招生信息 | 香港大学计算机视觉与机器智能实验室(CVMI Lab)博士招生

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达实验室概览香港大学电子与电气工程系的计算机视觉与机器智能实验室(CVMI Lab)致力于赋予机器感知、理解和重建视觉世界的能力。我们的研究领域主要包括:3D场景理解:开发3D数据(如点云)的表示学习技术,研究RGB-D/3D语义理解(如语义分割、目标检测、实例分割)和配准任务。高效深度学习:致力于开发计算高效的深度学习算法和数据...
转载
发布博客 2024.11.05 ·
25 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多