![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
物体检测
文章平均质量分 81
深蓝学院
深蓝学院(www.shenlanxueyuan.com)是专注于人工智能的在线教育平台,由中科院自动化所毕业博士团队创建。
展开
-
SL-SLAM:精度超越ORB-SLAM3,利用深度学习进行特征点检测的鲁棒系统
整体上来说,本项工作侧重的是工程实现和实验部分,可以为研究者提供良好的工程实现参考。原创 2024-05-21 10:21:20 · 925 阅读 · 0 评论 -
自动驾驶纯视觉3D物体检测算法
本文总结于王岩博士在2021年9月11日在深蓝学院的公开课。王岩博士就读于康奈尔大学,提出的基于伪点云的纯视觉3D物体检测算法广泛应用于工业界。本次的讲座分为如下几个部分,第一个是关于用相机做深度估计和背景检测的背景和动机,第二个是单目和双目深度估计算法的基础,第三个是关于深度检测的优化和提升,第四个是关于目前存在的问题。首先,为什么要做3d物体检测,因为在自动驾驶场景中,我们通常需要去感知场景中的每一个物体,只有在这个基础上,我们才能进一步进行物体跟踪和路径规划,也就是说,物资检测是自动驾驶感知流原创 2021-09-23 17:01:32 · 748 阅读 · 0 评论 -
揭秘自动驾驶纯视觉算法,探索自动驾驶的未来
感知环节作为智能驾驶的先决条件,其探测精度、广度与速度将直接影响决策层的判断与执行层的操作,在智能驾驶中的地位至关重要。自动驾驶感知分为纯视觉感知和激光雷达,而视觉方案中的摄像头能以高帧率、高分辨率获取周围复杂的环境信息,且价格便宜。但摄像头是一种被动式传感器,其本身并不发光,成像质量受到环境亮度影响较大,在恶劣环境下完成感知任务的难度会大幅提升。相较于激光雷达,摄像头有哪些优势和劣势?自动纯视觉3D物体检测的发展与挑战又如何?基于此,深蓝学院特基于Pseudo-LiDAR的纯视觉3D物体检测算法原创 2021-09-09 12:22:52 · 753 阅读 · 0 评论 -
深度隐式表达系列 (一)
*本文是文章的第一部分,请大家持续关注原创作者文章~概述深度隐式表达(Deep Implicit Representation, DIR) 在 2019 年同期发表了一系列代表性的工作。本文主要介绍 Deepsdf [4] 以及 Occupancy Networks [2] (OccNet) 两篇文章,之后会介绍一些其他的工作,本系列仅涉及部分代表性的 DIR 工作,读者感兴趣的话可以自行查找其他相关的工作。值得注意的是,这里 DIR 的说法是比较严格的,Openreview 上关于GRF.原创 2021-04-30 19:10:35 · 2369 阅读 · 2 评论 -
⽬标⾏动及稠密环境未知情况下,⽆⼈机跟踪的系统解决⽅案
本文是对《Fast-Tracker:A Robust Aerial System for Tracking Agile Target in Cluttered Environments》的⽂献解读。(文末附原文章链接)Author: Zhichao Han*, Ruibin Zhang*, Neng Pan*, Chao Xu, and Fei GaoPublisher: ICRA 2021Editer: 柯⻄摘要该⽂给出了在⽬标⾏动未知,稠密环境未知的情况下,⽆⼈机跟踪的系..原创 2021-04-26 14:56:20 · 346 阅读 · 0 评论 -
更灵活、有个性的卷积——可变形卷积(Deformable Conv)
作者简介CW,广东深圳人,毕业于中山大学(SYSU)数据科学与计算机学院,毕业后就业于腾讯计算机系统有限公司技术工程与事业群(TEG)从事Devops工作,期间在AI LAB实习过,实操过道路交通元素与医疗病例图像分割、视频实时人脸检测与表情识别、OCR等项目。目前也有在一些自媒体平台上参与外包项目的研发工作,项目专注于CV领域(传统图像处理与深度学习方向均有)。前言相信大家在看paper的时候或多或少都能见到Deformable操作的身影,这种可变形操作可嵌入到算法中的许...原创 2020-12-15 14:25:20 · 4833 阅读 · 1 评论 -
RoI Pooling 系列方法介绍(文末附源码)
作者简介CW,广东深圳人,毕业于中山大学(SYSU)数据科学与计算机学院,毕业后就业于腾讯计算机系统有限公司技术工程与事业群(TEG)从事Devops工作,期间在AI LAB实习过,实操过道路交通元素与医疗病例图像分割、视频实时人脸检测与表情识别、OCR等项目。目前也有在一些自媒体平台上参与外包项目的研发工作,项目专注于CV领域(传统图像处理与深度学习方向均有)。前言RoI Pooling 是目标检测任务中的常见手段,最早在 Faster R-CNN 中提...原创 2020-12-14 17:53:32 · 491 阅读 · 0 评论 -
物体检测的过去、现在和未来
本报告分为4个部分,物体检测的简介、物体检测的过去、现在以及未来,每个部分都从学术和工业两种角度进行分析介绍。上图简单描述了物体检测的发展历程时间轴。2012年深度学习热潮兴起,接着2013年有学者将深度学习应用到检测领域,开启了传统方法向深度学习的过渡转变。我将2019年之前的发展视为物体检测的过去,2019年至2020年看作检测的现在,2020年以后属于检测的未来。2013年之前检测方法大多以传统方法为主,特征提取加分类器是那些年检测的重心所在,2013年至2016年是检测的飞速发展阶段...原创 2020-08-18 19:22:07 · 882 阅读 · 0 评论 -
端到端声源分离研究:现状、进展和未来
本文是由罗艺老师主讲的『端到端声源分离研究进展』f分享整理而来。内容主要覆盖了单通道和多通道上端到端音源分离的现状和进展以及未来的研究方向。文末有彩蛋,评论可获取课程学习资料~端到端音源分离定义与进展什么是端到端音源分离呢?罗艺老师首先介绍了端到端音源分离的定义。从名称来看,端到端的含义是模型输入源波形后直接输出目标波形,不需要进行傅里叶变换将时域信号转换至频域;音源分离的含义是将混合语音中的两个或多个声源分离出来。(图1)目前,端到端音源分离已经有了一些在时域和频域上的研究,罗艺老师以原创 2020-08-14 15:41:49 · 2632 阅读 · 3 评论 -
基于三维点云场景的语义及实例分割:RandLA-Net和3D-BoNet
本文整理自牛津大学的杨波和胡庆拥在深蓝学院的线上公开课论文演讲。两位作者都是来自牛津大学的博士生,RandLA-Net和3D-BoNet分别发表在CVPR20和NeurIPS19上,两份工作都具有非常大的贡献。前者着力于大规模场景的点云语义分割,后者着力于点云实例分割的速度和精度的平衡。原公开课免费观看:https://www.shenlanxueyuan.com/open/course/53本报告分成了4个部分,作者先是介绍了深度学习在点云领域的相关背景,然后由RandLA-Net一作胡博士介.原创 2020-07-24 12:32:30 · 2027 阅读 · 0 评论 -
物体检测 | 29篇顶会(刊)论文集
张士峰,中科院自动化所模式识别国家重点实验室博士研究方向为基于深度学习的物体检测,包括通用物体检测、人脸检测、行人检测。博士期间,已发表论文29 篇,其中以第一作者和共同第一作者发表论文21篇,包括顶级期刊TPAMI、UCV和IJCV共3篇,顶级会议CVPR 4篇、ICCV 1篇、ECCV 1篇、AAAI 4篇,IJCAI 1篇,以及其他作者论文7篇;谷歌引用次数突破1000,目前是1050。单篇第一作者论文在2年时间被引用400次左右。授权专利2 项,在申专利3 项,担任TPAMI、IJCV、TN原创 2020-07-20 18:48:16 · 1700 阅读 · 0 评论