![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能
文章平均质量分 85
深蓝学院
深蓝学院(www.shenlanxueyuan.com)是专注于人工智能的在线教育平台,由中科院自动化所毕业博士团队创建。
展开
-
算法岗求职,如何做出让人眼前一亮的简历?
使用清晰的字体和合适的字号,会使简历更易于阅读。最后再说一句,一份优秀的简历固然重要,但更重要的还是应聘者的自身实力,只有通过夯实理论基础,丰富实践经验,提升自身条件,你才能真正入企业招聘者的“法眼”。所以在编辑在简历内容的过程中,最重要的是展示真实的自己,在介绍自己专业素养的同时,也要注意将个人特点和个性融入其中,以使你能够在众多求职者中脱颖而出。图文并茂,很多人忽视了在简历中插入图片的重要性,合适的项目照片不但可以让简历排版更加美观,也可以直观地让企业了解你的项目内容,一下子吸引住HR的目光。原创 2023-06-02 18:50:05 · 652 阅读 · 0 评论 -
面向移动机器人的道路环境感知
(1)由于不再需要标记的训练数据,卷积神经网络和传统计算机视觉算法的结合为无监督/自监督的场景理解提供了一种可行的解决方案(2)数据融合方法提供了更好的场景理解准确性(3)使用现代深度学习算法进行路况评估是需要更多关注的研究(4)在资源有限的硬件上实现人工智能算法时,我们还需要考虑计算复杂性,因为今天讨论的应用程序通常需要实时性能来源:深蓝学堂EDU。原创 2023-05-19 16:28:32 · 718 阅读 · 0 评论 -
精华文稿|声纹识别可靠评测
引言近年来,声纹识别技术发展迅猛,在一些基准评测中取得了令人鼓舞的性能。然而,基于这些主流技术所搭建的声纹识别系统在实际应用中的表现却难言可靠。从应用方的反馈来看,声纹识别系统在许多应用场景下的鲁棒性并不理想。这种基准评测和应用表现的不一致性问题,极大地困扰了声纹识别的研究者和从业者,也限制了声纹识别技术的大规模推广应用。为了理解和解释这种不一致性问题,本报告将从声纹评测的视角出发,在评测数据(Data)、测试列表(Trial)和评价指标(Metric)三个维度上进行分析,并尝试给出一些可靠的解决方案。原创 2023-03-08 11:33:14 · 554 阅读 · 0 评论 -
机器人运动|浅谈Time Elastic Band算法
现在,我们再来看global_plan_viapoint_sep在局部规划中的作用,该参数的描述为“从全局路径中选取的每两个连续通过点之间的最小间隔”,结合对viapoint的理解,从该描述中我们可以知道,该参数影响的是teb_local_planner规划的最优轨迹对全局路径的跟随效果。在实际的开发过程中,更多地需要考虑机器人自身其他模块的性能,例如电机能够提供的最大加速度,定位算法的精度等,同时也要考虑具体的环境以及选择Time Elastic Band算法是否合理,如此才能将其性能发挥出更好的效果。原创 2023-03-08 11:18:44 · 1198 阅读 · 0 评论 -
实用|5个提速深度学习模型的方法
我们应该期待我们的推理时间有相当大的改进,记住我们的模型仍然需要通过一个主干,虽然相当数量的推理时间发生在主干上,我们模型的外层仍然可以有对推理时间有很大影响。而实际上,还不止这些。更好的是,如果我们实现了前面描述的任何方法,我们就可以重用该工作,并决定对我们的模型进行任何修改。以物体检测问题为例,一些模型专门针对速度进行了优化,例如 YOLO,而同时其他模型提供了多种配置,这些配置随神经网络的深度和它们接收的输入的大小而变化,例如 EfficentDet,允许你训练和比较准确度与速度之间的权衡如何变化。原创 2023-03-08 11:11:43 · 359 阅读 · 0 评论 -
最新|移动机器人导航定位技术概述
经过多年的发展,移动机器人的导航系统也逐渐从最初的有轨导航到无轨导航发展和进步,在传统AGV的基础上,伴随着技术的发展,AMR(自主移动机器人)的概念被提出并开始逐渐占据应用市场,其与传统AGV的自动导引相比,AMR更强调机器人的自主性和灵活性。移动机器人和无人机等是不能够像工业机器人利用关节处的力矩传感器和编码器的读数直接进行位姿的解算的,抛开工业机械设计制造及其装配时带来的误差,移动机器人和无人机等内置的传感器往往会因为轮子打滑、IMU噪声等问题引入难以忽略的误差。原创 2023-03-03 15:46:20 · 1233 阅读 · 0 评论 -
干货文稿|详解深度半监督学习
传统机器学习中的主流学习方法分为监督学习,无监督学习和半监督学习。这里存在一个是问题是为什么需要做半监督学习?首先是希望减少标注成本,因为目前可以在很多现实场景中去获得大量的图片,那么需要标注的量和成本会几何增加。第二个是目前对所有大规模的数据进行标注进而训练模型是不现实的,因此可以使用一种方法使得用未标注的数据进行性能提升。原创 2023-03-03 12:32:58 · 631 阅读 · 0 评论 -
CA-SSL:用于检测和分割未知类的半监督学习
论文作者 | Lu Qi, Jason Kuen , Zhe Lin, and etal论文来源 | CVPR2022文章解读 | William1、摘要为了提高检测/分割的性能,现有的自监督和半监督方法从未标记的数据中提取任务相关或任务特定的训练标签,但这两种方法对于任务性能都是次优的,使用过少的特定任务训练标签会导致下游任务的ground-truth标签欠拟合,反之则会导致对ground-truth标签过拟合。原创 2023-03-03 12:24:56 · 355 阅读 · 0 评论 -
逆风翻盘拿下感知实习offer,机会总是留给有准备的人
读研还有一个坏处,就是遇到不好的导师,太过压榨学生,假如你已经工作过了,哪里还需要看别人的脸色,不开心就可以退学,大不了自学。比如参加竞赛,同一段时间,就专注参加一个,最多两个,除了已经做好了,并且排名靠前,才可以参加别的,不然会得不偿失,顾此失彼,我以前经常这样,导致很多原本可以拿奖的比赛拿不了奖,心太大也不好。(6) 本科就业,目标是算法岗的话,可以尝试,但是不要抱太大的期待,尤其是进大厂很难,当然并不是没有希望,我大四就去快手实习过,只是无法转正,但是可以降低预期,去小公司,初创企业,还是可以的。原创 2023-02-24 18:18:41 · 488 阅读 · 0 评论 -
基于Frenet优化轨迹的⾃动驾驶动作规划⽅法
由此可以看出,最终的优化轨迹的选择并不单纯基于最⼩损失函数,轨迹检查还会过滤掉⼀些轨迹,所以使⽤基于Frenet的优化轨迹来做⾃动驾驶汽⻋的动作规划,通常能够找到有限集的最优解,当最优解⽆法通过检查是,⾃会采⽤“次优解”甚⾄更加“次优的”解。值得注意的是,以上的损失函数仅适⽤于相对⾼速度的场景,在极端低速的情况下,⻋辆的制动能⼒是不完整的,我们不再将d表⽰为关于时间t的五次多项式,损失函数也会略有不同,但是这种基于有限采样轨迹,通过优化损失函数搜索最优轨迹的⽅法仍然是⼀样的,在此不再赘述。原创 2023-02-24 17:47:08 · 1025 阅读 · 0 评论 -
导航定位状态评估专题:“特征”离群点判断与剔除 | 定位状态完整性监控
在每一次机器人执行各种目的的自动导航任务时,拥有高精度且可靠状态估计的能力可以说是机器人顺利、安全完成任务的必要条件之一。简而言之,机器人状态估计算法不单单需要提供精准的状态估计量,还需要能准确地表征状态估计的准确度,比如在退化和传感器失效等场景,状态估计器能提示状态机或者用户此时刻的估计值的准确度风险,不能机器人的状态估计明显“飘”了,还在提示“一切安好”。现在回到本章节的问题:经典状态估计中协方差的计算能准确反映机器人状态的完整性吗?,该解答需要的是理解经典状态估计算法中的前提假设和模型构建。首先,典中原创 2023-02-23 17:47:15 · 528 阅读 · 0 评论 -
人工智能、机器学习和深度学习有哪些区别?
直到2012年之前,这两种声音还在同时存在。3. 深度学习的思想,来源于人脑的启发,但绝不是人脑的模拟,举个例子,给一个三四岁的小孩看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩也十有八九能做出那是一辆自行车的判断,也就是说,人类的学习过程往往不需要大规模的训练数据,而现在的深度学习方法显然不是对人脑的模拟。传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。原创 2023-02-17 14:12:33 · 1226 阅读 · 0 评论 -
多传感器融合:MVP和PointPainting
在当时 3D 物体检测还是以 Lidar-Only 的方式为主,因为融合的算法并不能体现明显的优势,但是很显然,Lidar 的信息有限、检测精度有限。不过我们还是需要有一些思考,虽然这样的方式可以提升性能,但是图像分割不是绝对准确的,如果赋错了怎么办?多传感器融合相关的理论真的可以非常复杂,而在感知方面,由于可以和深度学习做结合,所以很多工作可以变得简单有效,有时候一个简单的特征融合都会有很好的效果。针对Lidar信息有限的问题,解决思路有两个,一个是挖掘更多的信息,但是这条路很难走;原创 2023-02-17 12:27:49 · 309 阅读 · 0 评论 -
深度学习|论文中常用的注意力模块合集(下)
注意力机制可以增加少量参数的情况下来提升计算精度和模型性能,在论文中常用的注意力模块合集(上)中介绍了三种注意力机制,它们分别是CA、CBAM和SE,均在目标检测和语义分割领域内能够提升模型的性能,废话不多说,直接开始讲解剩下的论文中常用的注意力模型。1、有效通道注意力(Efficient Channel Attention Module, ECA)深度学习中,降维不利于学习通道注意力,但是适当的跨通道交互可以在显著降低模型复杂性的同时保持性能。原创 2023-02-10 17:03:06 · 4528 阅读 · 0 评论 -
论文中常用的注意力模块合集(上)
在深度卷积神经网络中,通过构建一系列的卷积层、非线性层和下采样层使得网络能够从全局感受野上提取图像特征来描述图像,但归根结底只是建模了图像的空间特征信息而没有建模通道之间的特征信息,整个特征图的各区域均被平等对待。在一些复杂度较高的背景中,容易造成模型的性能不佳,因此可以引入注意力机制,而注意力机制的原理是通过参考人的视觉感知能力,即人在处理视觉信息初期会集中专注于当前情景下重点区域,而其他区域将相应降低,这为更高层级的视觉感知和逻辑推理以及更加复杂的计算机视觉处理任务提供更易于处理且更相关的信息。原创 2023-02-10 16:08:33 · 5149 阅读 · 0 评论 -
空间剪枝:使用自适应滤波器来改进稀疏CNN的训练
(6)使用损失L的梯度来训练FB系数λ和F。对于SP,表示网络的参数,其包含IP设置中除FBs自身之外的所有参数。因此,∧对于IP和SP具有完全相同的元素数量。修剪率等式(9)是等于零的参数分数。为了在IP和SP之间的进行公平比较,将非零参数的数量与标准密集网络(即没有FBs的密集网络)中的系数总数进行归一化,与卷积层和完全连接层相比,偏差和批量归一化参数的数量很少。此外,在实验中,FBs的所有参数加在一起最多为D的0.01%。因此,我们只修剪完全连接层的权重以及卷积层的空间和FB系数。原创 2023-02-10 15:40:24 · 823 阅读 · 2 评论 -
麻省理工出版 | 2023年最新深度学习综述手册
全书从机器学习基础概念到深度学习各种模型,包括最新的Transformer和图神经网络都有介绍,比较系统全面,非常值得深度学习入门者关注,也可以帮助大家更好地了解不同深度学习算法的最新研究情况,深蓝学院已经将完整的。Chapter 19 - 深度强化学习 Deep reinforcement learning。Chapter 17 - 变分自编码器 Variational auto-encoders。Chapter 4 - 深度神经网络 Deep neural networks。原创 2023-02-09 17:39:59 · 1700 阅读 · 0 评论 -
精华文稿|迈向统一的点云三维物体检测框架
3D检测是在三维世界中去定位和分类不同的物体,与传统2D检测的区别在于它有一个深度信息。目前,大部分的工作是倾向于用点云去做三维检测,点云实际上是通过传感器去扫描出来的一系列点,这些点是分布在物体的表面,所以通过点云可以清楚的观察到一个物体的形状,所以最终做三位检测的准确率也会更高。点云实际上有三个特点,首先是无序性,其次是稀疏性,第三是无法准确的描述一个物体。原创 2023-02-09 17:29:36 · 488 阅读 · 0 评论 -
计算机视觉未来发展与走向
因此,站在巨人的肩膀上谈计算机视觉的未来走向,可以很明确地说,技术的产生本身就是为人民服务的,如果有更好的技术替代,新技术的产生必然会造成旧技术走向衰落。从研究者的角度来说,学术研究过于依赖大数据的训练,而训练数据对算力要求很高,进而引出计算机硬件成本过高的问题,硬件和软件是相辅相成的关系。人工智能的兴起,使得多数人都在讨论AI技术如何落地,我们可以预言的是,计算机视觉在未来与机器人结合,赋予机器人“眼睛”,这里所谈及的机器人可以是服务机器人、特种机器人、无人驾驶、AR等等。它是由图像处理到图像。原创 2023-01-16 12:30:47 · 934 阅读 · 4 评论 -
规划之路:SLAM学习经验分享
在实验室学了这么久,从最初报名深蓝学院高翔博士的视觉SLAM基础课开始,我正式踏足SLAM的学习之路,跟随课程的学习一步一步地推导公式,比如相机的运动求解R、t,图像中特征的提取,扩展卡尔曼滤波理论及集束调整BA等一系列公式,确实感觉到了SLAM理论的强大,在这过程中为我后续学习SLAM打下了坚实的数学基础。作为一个刚入坑SLAM一年多的初学者,首先想说的就是这个研究方向比较广,大方向按搭载传感器分为激光SLAM和视觉SLAM两种,激光SLAM搭载激光雷达,视觉SLAM搭载单目、双目、RGBD相机三大类。原创 2023-01-16 12:22:38 · 784 阅读 · 0 评论 -
如何学习C++图像处理?
为避免图像阵列大导致直接在空间域进行处理时计算量过大,我们往往需要先对图像采用图像变换,图像变换的方法包括有傅里叶变换、沃尔什变换、离散余弦变换等间接处理方法,将空间域的处理转换为变换域处理,不仅可以减少计算量,还能获得更为理想的处理效果。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。:图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。原创 2023-01-16 12:18:31 · 2457 阅读 · 0 评论 -
综述 | 深度强化学习在自动驾驶中的应用
本文是2020年的综述论文《Deep Reinforcement Learning for Autonomous Driving: A Survey》的部分内容节选。翻译稿全文共2万6千字,本文略掉了第3、4节强化学习理论的介绍及扩展部分。随着深度表征学习(deep representation learning)的发展,强化学习(RL)领域已经形成一个强大的学习框架,并且如今已经具备在高维环境中学习复杂策略的能力。本综述总结了深度强化学习(DRL)算法,并且对采用了(深度)强化学习方法的自动驾驶任务进行了原创 2023-01-16 11:59:52 · 3409 阅读 · 0 评论 -
面经分享|2022年秋招斩获7个规控算法工程师offer
而对于应付面试来说,还需要理解的记忆一些常见八股文,基本是面试的必考环节,常考的如虚函数、智能指针、多态等知识,如果背的不够的话,很可能回答的时候漏掉一些关键的知识点,导致面试官认为你的基础掌握不够扎实,因此只有背的足够多才能在面试中从容的面对。真心希望对自动驾驶有热情的同学能够加入到自动驾驶这个行业中来,贡献自己的一份力量,也希望通过这个面经,启发更多的同学,让大家有所收获,只要按照合理的时间线来进行学习,认真学习和复习相关的课程,一定能够在面试披荆斩棘,拿到满意的工作,加油!整体上偏向决策或规划岗位。原创 2023-01-06 15:51:20 · 1521 阅读 · 0 评论 -
ReFactor GNN:从消息传递角度重新审视FMs
分享嘉宾 | 陈艺虹文稿整理 | William。原创 2023-01-06 15:13:00 · 658 阅读 · 0 评论 -
声纹识别可靠评测
由模型结果与实际评测结果存在较大的差距出发,提出了Reliable speak recognition概念,希望设计一个可靠的评测方案,能够去解释这个现象。最后落在了三个主题上面,首先是data,构造更具有复杂性的描述真实世界变动性的data。第二个是trial,希望更关注于hard trials。第三个是metric,希望能够更好的、更系统性的去描述系统的性能,然后比较系统的性能,所以,延伸出来C-P map。原创 2023-01-06 12:18:33 · 685 阅读 · 0 评论 -
三个月转行SLAM,他的心路历程
自学能力算是很不错了,第一次创业自己写完Android、写iOS两个平台都写了,后台搞不赢也写后台,写过三维图形的程序、读研期间写过区块链、搞过深度学习、参加见过比赛混到了某个国际比赛医学图像识别赛几个道的几张2、3、4、5名的奖状。目前无人车、无人机、机器人爆发的时候,我觉得slam以及其相关的技术是一个不错的可以深入研究的技术。目前我自己的公司也在做,我已经处于半退出状态,所以决定用三个月的时间来学习相关的工程问题,先爬上巨人的脚背,三个月后开始找工作,不求报酬,只为做关键的工程问题。原创 2022-12-20 12:04:52 · 383 阅读 · 0 评论 -
slam和ros之间的是什么关系?
SLAM应用到IMU、视觉、轮速计、激光等传感器的时候,开发人员需要实现这些传感器信息的同步,在框架支持ROS后只要把传感器的topic做相应的修改,同时对这些topic的时间、tf关系、环境进行维护,把然后把这些信息在对应的launch进行调整,SLAM算法便可以跑起来。同时当需要对不同框架之间进行信息交互的时候,比如一个建图框架的算法需要里程计信息,可以通过ROS把SLAM框架中的里程计信息发布出来,建图框架订阅发布出来里程计信息,边完成了里程计信息的交互。学习ROS可以当成学习SLAM的一部分。原创 2022-12-20 11:55:06 · 628 阅读 · 0 评论 -
跨平台移植 | 如何尽快适应大型C++项目?
第一次接触这种规模的项目,应该怎么让自己尽快上手。项目里从上世纪九十年代的代码到现在的代码,文件名有全是大写也有全是小写的,变量名有缩写的也有一个字母不拉的,各种不统一看着脑仁子疼。这可能是最为痛苦的过程,此时是你第一次阅读项目代码,你需要找出架构部分,并理解整个代码的主要设计思路和设计范式,架构部分的代码量通常不会那么大,但是较为难懂,个人认为架构部分必须要完全读懂,这样才能搞明白整个程序是如何work起来的,各组件之间有什么样的关系,这会更好的帮助你理解各个组件的实现。那我就先说一下题主的实际问题。原创 2022-12-20 11:38:36 · 842 阅读 · 0 评论 -
必读干货|使用Cmake管理C++项目简明教程
他们之间的调用关系复杂而严格,如果想在这样复杂的框架下进行二次开发,显然只拥有它的源码是远远不够的,还需要清楚的明白这几十个项目之间的复杂关系。原作者只需要生成一份CMakeLists.txt文档,框架的使用者们只需要在下载源码的同时下载作者提供的CMakeLists.txt,就可以利用CMake,在原作者的帮助下进行工程的搭建。Cmake编写的过程实际上是编程的过程,不过你需要编写的是 CMakeLists.txt(一般情况下每个目录一个),使用的是“Cmake”语言和语法。#Cmake工程名。原创 2022-12-20 11:08:30 · 842 阅读 · 0 评论 -
实时单目追踪和稠密建图的算法框架:TANDEM算法
2.1单目视觉里程计简单总结,TANDEM使用了稠密追踪前端和稀疏后端优化相结合的方式来提高追踪性能。2.2稠密前端追踪TANDEM前端的特点:提供实时相机帧频的追踪作为后端窗口优化的初始化输入实现前端稠密点追踪(相较于DSO而言)DSO的前端做法是,一张新的输入帧,基于过去n个关键帧来实施直接配准,而这n帧构建了一个稀疏深度图 ,这个深度图是由优化窗口中所有的点生成而来的。DSO的做法是得到一个稀疏深度图,所以鲁棒性较差。原创 2022-12-20 10:53:48 · 657 阅读 · 0 评论 -
『解读』TEASER | 快速且可证明的点云配准算法和代码解读
来源深蓝学院:深蓝前沿教育本文是对文章《TEASER:Fast and Certifiable Point Cloud Registration》的解读。摘要这篇文章提出了第一个快速且可证明的算法,用于存在大量外点对应的情况下两组3D点的配准。可证明的算法尝试求解一个困难优化问题(比如带外点的鲁棒估计),提供相对容易的检测条件验证返回的解是否最优(比如,如果算法在外点存在情况下产生最精确的估计)或者界限解的次优性或精确性。为了达到这个目的,我们首先使用截断最小二乘(TLS)代价函数将配准问题重新建模,使得估原创 2022-12-05 14:53:17 · 576 阅读 · 1 评论 -
ScanContext 论文详解 - 用途:Lidar SLAM 回环检测、空间描述符
Figure 1. 激光雷达沿着方位角(浅蓝)与放射方向(黄)的Bin分割 [1]Figure 2. Scan Context示意图 [1]1Scan Context,从英文字面理解就是“”。类比于我们阅读的时候,需要理解上下文,才能明白其意,LidarSLAM在进行回环检测的时候,也需要将“上下文” (之前的数据)进行比较,方才知道我们是不是又走到了之前的同一个地方()。原创 2022-11-17 15:57:42 · 1045 阅读 · 1 评论 -
基于点线特征的激光雷达+单目视觉里程计
我们在公开的 KITTI训练数据集上测试了我们的方法,该训练数据集包含具有地面真实轨迹的00-10序列,并在64位Linux操作系统的Inte Core i7-2600@2.6GHz和8G内存的计算机上分析了方法的精度和时间效率。我们在KITTI数据集序列00(左)和05(右)上的运动跟踪轨迹,分别用我们的完整的系统(*)、没有深度优先模块的系统(-)和没有尺度校正模块的系统(#)与地面真值(GT)轨迹进行比较的结果。本文介绍了一种新颖的使用点和线的激光雷达+单目视觉的里程计方法。原创 2022-11-17 14:35:41 · 343 阅读 · 0 评论 -
机器人及无人驾驶领域真实人才供需状况如何?企业真正需要什么样的人才?
大家在求职过程中会遇到很多问题:自动驾驶未来行业发展会怎样?企业更看重求职者什么样的能力?这些问题在让很多有志在移动机器、自动驾驶等领域发展的伙伴感到迷茫。深蓝学院近期有幸邀请到了吴伟、李相根、高翔参加算法求职系列直播活动,对大家在算法求职中可能遇到的问题进行解答,我们整理了精华部分,希望能够对大家有所帮助。特邀嘉宾(排名不分先后)【注】为方便大家阅读,采用以下简写吴:吴伟老师(极智嘉)李:李相根老师(云鲸智能)高:高翔老师(智行者)我们在直播中向老师提出了6个问题,三位老师分别给出了分析与解答。一、六大问原创 2022-11-16 17:44:12 · 438 阅读 · 0 评论 -
语音领域,对于入门学生和初入职场者需要具备什么能力?
是专注于人工智能的在线教育平台,已有数万名伙伴在深蓝学院平台学习,很多都来自于国内外知名院校,比如清华、北大等。本文整理的三个问题是老师们对于现在是否有必要学习传统方法以及给工作中的伙伴们的一些建议,文末整理了大家在直播中提问的一些问题,希望大家可以通过老师的分享能够有所启发。(排名不分先后)曾先后在百度、北京猎户星空供职,主要负责各场景下语音识别声学模型优化,语言模型优化,声纹系统搭建等工作。原创 2022-11-09 14:39:58 · 1408 阅读 · 0 评论 -
从民办三本到知名企业感知算法工程师
秋招结束后,我拿到了3个机器人与无人驾驶知名企业的offer,最终决定加入高仙机器人担任感知算法工程师。我是管郡智,网名無為,本硕均就读于双非高校,其中本科是民办三本传统车辆工程专业,与人工智能的交集只有数学和C语言。于2019年10月(研二论文开题前一个月)开始接触三维点云目标检测算法,在今年的秋招中拿到了心仪的offer,这个过程发生的一切,足以影响我的一生。写这篇文章的目的有两个:一是为了激励正迷茫的硕士研究生,二是说明韧性和学习方法也可以争取到机会。目录1. 求职篇2. 学习方法篇。原创 2022-11-09 12:17:24 · 323 阅读 · 0 评论 -
必读!三维点云24篇精选论文
三维点云是最重要的三维数据表达方式之一,SLAM、三维重建、机器人感知等多个领域,点云都是最简单、最普通的表达方式。三维点云处理在学习中需要参考大量的论文资料文献,但在众多的论文中,有哪些论文是必读的呢?,并根据三维点云应用的不同方向分类,希能为大家提供一定的帮助。课程上,黎嘉信老师为我们推荐了很多必读的论文,助教管郡智结合老师推荐的论文,为我们整理了。原创 2022-11-09 11:25:51 · 1088 阅读 · 0 评论 -
智能语音领域人才内卷严重?我们应该具备什么样的能力?
一些短视频里面音频内容的产出、直播里面声音的监管、客服的质检,还有外卖、打车里面都有很多的场景,以及现在风口最对的在线教育类的一些公司也都有自己的语音团队去做一些落地,在这些公司里,语音还是真正的赋能了。其实内卷这个词我也是前两天才听说的,至少上个月我大脑里的语音识别系统还无法识别内卷这个词,不知道线上的ASR模型会得到什么样的结果,这也可以从侧面看出,正是因为语言的变化,还有一些场景的多样性,语音技术其实还有很多实际的问题需要解决,真正到了落地的时候,我们还要花很多精力,投入很多时间去把这个事情做好。原创 2022-11-02 17:18:35 · 187 阅读 · 0 评论 -
图像处理:U-Net中的重叠-切片(Overlap-tile)
最直接的是对输出结果再进行一次上采样,可以使用插值或者转置卷积的方法,若使用插值,由于其是不可学习的,会带来一定的误差;(缩放通常使用插值算法,主流的插值算法如双线性插值具有低通滤波的性质,会使得图像的高频分量受损,从而造成图像轮廓和边缘等细节损失,可能对模型学习有一定影响),同时它还能起到。上图左边是对原图进行镜像padding后的效果,黄框是原图的左上角部分,padding后其四周也获得了上下文信息,与图像内部的其它区域有类似效果。下图蓝框部分是原图的左上角部分,镜像填充后,得到红框部分。原创 2022-11-02 17:10:10 · 1599 阅读 · 1 评论 -
分散式车辆协同:伯克利DeepDrive无人机数据集B3D
在20个经过处理的视频中,有8个是在路口上录制的,12个是在高速公路上录制的,视频格式为mp4,数据集的结构如图1所示。在hwy01.mp4的13:10,在帧中间发现了另一个碰撞事故。为了训练用于车辆检测的神经网络模型,作者从20个视频中每15秒提取一个帧,然后手动标记一个轴向对齐的边界框,在选定的帧中的每个车辆。B3D数据集中记录的场景可以分为以下六类:1)无信号灯控制的交叉路口,2) 无信号灯控制的环形交叉口,3)追尾事故,4)走走停停的车流,5)道路施工引起的车流合并,以及6)匝道引起的合并。原创 2022-11-02 15:57:19 · 420 阅读 · 0 评论