- 博客(88)
- 收藏
- 关注
原创 【深度估计 Depth Estimation】数据集介绍
11 个场景(Artroom、Bandsaw、Chess、Curule、Octogons、Pendulum、Skates、Skiboots、Traproom、Ladder、Podium),每场景 1–3 个视角;克隆 KITTI Tracking 基准的 5 条序列(Scene01、Scene02、Scene06、Scene18、Scene20),并引入不同天气(雾、雨)与相机旋转(±15°)变体。同步采集自 3 个城市的 464 个不同室内场景(公寓、办公室、走廊等),20–30 FPS 视频序列。
2025-05-22 00:00:00
1053
原创 【强化学习】深度强化学习 - Deep Q-Network(DQN)算法
Deep Q-Network(DQN)结合了Q-learning与深度神经网络,通过卷积网络或多层感知机逼近动作价值函数,并利用经验回放和目标网络技术稳定训练,使其在高维状态空间(如像素)中表现出色。DQN自2015年提出以来,已成为深度强化学习的基石算法,广泛应用于游戏和机器人等领域。其核心原理包括Q-learning的回顾、深度网络逼近Q函数、经验回放、目标网络、损失函数和ε-贪心策略。算法流程涉及初始化、动作选择、存储转移、批量更新、目标网络同步和ε衰减。典型实现步骤包括环境与依赖的安装、Q网络的定义
2025-05-21 00:00:00
1129
原创 【视觉任务】深度估计(Depth Estimation)介绍(2025年更新)
深度估计(Depth Estimation)是指从二维图像或多视图输入中预测场景中每个像素到摄像机的距离,输出通常为深度图。该任务是三维重建、场景理解、自动驾驶与增强现实等下游应用的关键前置步骤。多视几何:基于特征点匹配与三角化重建深度,经典算法包括 SIFT 匹配与光度一致性优化。形状从焦:利用不同焦距图像中的模糊程度估计深度,同样属于几何推导范式。
2025-05-16 15:32:39
909
原创 【优化算法】协方差矩阵自适应进化策略(Covariance Matrix Adaptation Evolution Strategy,CMA-ES)
CMA-ES(协方差矩阵自适应进化策略)是一种无导数的优化算法,适用于解决非线性、非凸的连续优化问题。其核心在于通过自适应调整搜索分布的均值、协方差矩阵和步长,利用最大似然原则和演化路径两大思想,高效地更新搜索分布参数。算法步骤包括初始化、采样、排序与加权重组、更新演化路径、协方差矩阵更新和步长控制。CMA-ES的优势在于无需梯度信息,能够自适应搜索方向,并具有较强的鲁棒性。以优化n维球函数为例,CMA-ES能够通过迭代使均值收敛至最优解。
2025-05-16 00:00:00
1031
原创 【强化学习】动态规划(Dynamic Programming, DP)算法
动态规划(Dynamic Programming, DP)是强化学习中基于模型(model-based)方法的核心,通过已知的环境模型(状态转移概率和回报函数)利用贝尔曼方程(Bellman Equation)反复计算值函数,从而推导出最优策略。
2025-05-10 00:00:00
1916
原创 【强化学习】强化学习算法 - 马尔可夫决策过程
马尔可夫决策过程 (MDP) 是强化学习 (Reinforcement Learning, RL) 中用于对问题进行数学建模的标准框架。它描述了一个智能体 (Agent) 与环境 (Environment) 交互的过程,其中智能体的目标是最大化其在一段时间内获得的总奖励。MDP 假设环境具有,即未来的状态和奖励只依赖于当前的状态和智能体采取的动作,而与过去的状态或动作历史无关。
2025-05-09 23:00:00
1008
原创 【强化学习】强化学习算法 - 多臂老虎机问题
核心思想:对每个臂aaa的未知奖励参数(例如,伯努利臂的成功概率pap_apa)维护一个后验概率分布。这个分布反映了基于已观察到的数据,我们对该参数可能取值的信念。在每个时间步ttt,为每个臂aaa从其当前的后验分布中抽取一个样本值θa\theta_aθa。这个样本可以被看作是该臂在当前信念下的一个“可能”的真实参数值。选择具有最大采样值θa\theta_aθa的那个臂AtA_tAt。观察所选臂AtA_tAt的奖励RtR_tRt。
2025-05-07 23:00:00
1160
原创 【强化学习】Q-Learning算法 - (Model-Free, Value-Based)
Q 表是一个二维表格,行表示状态(State),列表示动作(Action),单元格存储对应的 Q 值。例如,在迷宫导航问题中,每个位置(状态)对应四个动作(上、下、左、右),Q 表会记录每个动作的预期回报。的数据结构,记录每个状态-动作对的预期累积奖励(Q 值),从而帮助智能体(Agent)在环境中学习最优策略(选择最大化长期奖励的动作序列)。(选择最大 Q 值的动作),但实际选择动作时可能采用随机策略(如 ε-贪婪),即学习过程与执行策略分离。假设智能体需要从起点(左上角)走到终点(右下角),避免陷阱。
2025-05-07 01:00:00
1274
原创 【强化学习】什么是强化学习?2025
强化学习(Reinforcement Learning, RL)是一种机器学习范式,强调智能体(agent)通过与环境(environment)的交互,以试错(trial‑and‑error)的方式学习一套策略(policy),以最大化累积奖励(cumulative reward)。
2025-05-06 20:07:32
1361
原创 【机器人-开发工具】ROS 2(3)常见工具软件安装(2025持续更新......)
colcon是一个命令行工具,主要用于构建和打包软件,特别适用于机器人操作系统(ROS 2)以及其他使用catkin或ament等构建系统的项目。它是为了解决ROS 2中多个包的编译、依赖管理和扩展性问题而设计的,在ROS 2中取代了ROS 1中使用的和等构建工具。colcon简化了代码编译、依赖关系处理以及软件打包的过程。通过colcon,你可以更高效地管理复杂的机器人软件系统。
2025-03-25 15:21:18
559
原创 【工具使用-编译器】VScode(Ubuntu)使用
注:Ubuntu 下 VSCode 默认快捷键与 Windows 版基本一致,若有需要也可通过 “键盘快捷方式” 进行自定义调整。
2025-03-25 15:20:46
539
原创 【机器人-基础知识】标定 - 相机标定全解
相机标定是确定相机成像过程中各个参数的过程,它的核心目标是建立从三维世界坐标系到二维图像坐标系的数学映射关系。内参:描述相机内部光学特性(如焦距、主点位置、像素尺寸、畸变系数等)的参数。外参:描述相机在世界坐标系中的位置和姿态(即旋转和平移)的参数。通过相机标定,我们可以校正镜头畸变、实现图像矫正、并支持诸如三维重建、机器人导航等应用。在针孔相机模型中,三维世界中的一点经过一系列变换后在二维图像平面上成像。外参变换:将世界坐标系下的点转换到相机坐标系内参投影。
2025-03-14 17:29:35
1720
原创 【机器人-基础知识】标定 - 相机内参求解原理(单应性矩阵、内参约束方程)
单应性矩阵(Homography Matrix)是一个平面映射到另一个平面的映射矩阵,即将一个平面上的点映射到另一个平面上。
2025-03-14 16:26:36
1339
原创 【机器人-开发工具】ROS 2 (2)Ubuntu20.04安装ROS 2 Foxy版本
ROS 2 Foxy Desktop版本概述:这是为大多数用户推荐的安装选项,尤其是初学者。它包括了ROS 2的核心组件、构建工具、可视化工具如RViz、命令行工具等,以及一些示例程序。
2025-03-13 12:02:04
1831
原创 【机器人-开发工具】ROS 2(1)介绍
总体来说,ROS2在继承ROS1优秀特性的基础上,通过采用DDS通信、中间件改进、Executor调度以及安全增强等多项关键技术,构建了一个更高效、灵活且安全的机器人软件平台。无论是在工业应用、无人驾驶、还是教育科研领域,ROS2都展现出强大的生命力和广阔的发展前景,是未来机器人系统研发的重要方向。
2025-03-13 12:00:57
924
原创 【机器人-开发工具】ROS 1(1)介绍
ROS1(Robot Operating System 1)并非传统意义上的操作系统,而是一个为机器人开发设计的中间件框架。它由加州大学、斯坦福大学及其他机构共同推动发展,目的是降低机器人软件开发的复杂性,促进模块化和重用。ROS1通过提供标准化的通信机制和大量的工具,使开发者能够快速搭建和测试机器人系统。
2025-03-13 12:00:26
906
原创 【机器人-基础知识】欧拉角、旋转矩阵和四元数
欧拉角是一组三个角度,用于描述一个刚体在三维空间中的定向关系。具体来说,它们表示从一个固定参考坐标系到刚体坐标系的一系列旋转。常见的定义方式是将总体旋转分解为三个连续的简单旋转,每次旋转都绕着当前坐标系的某一固定轴进行。例如,一种常用的欧拉角序列是 Z–Y–X(或称为航向、俯仰、滚转顺序),其含义如下:这种分解使得三维旋转问题转化为三个独立旋转角度的叠加。以 Z–Y–X 顺序为例,刚体总旋转矩阵 RRR 可以写成三个旋转矩阵的乘积:R=Rx(ϕ) Ry(θ) Rz(ψ)R = R_x(\phi) \;
2025-03-12 15:07:53
2672
原创 【机器学习-基础知识】统计和贝叶斯推断
概率分布(Probability Distribution)指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。
2025-03-12 11:26:45
1431
原创 【深度学习-基础知识】批量归一化 (BN, Batch Normalization)
内部协变量偏移指的是在深度神经网络训练过程中,由于网络参数的更新,每一层的**输入分布**会发生变化,这种变化会影响到下一层的学习效果,使得训练过程变得不稳定,需要使用较小的学习率和精心设计的参数初始化策略来减轻其负面影响。
2025-03-11 14:35:14
921
原创 【深度学习-基础知识】梯度下降算法(2分钟学会)
梯度是多元函数在某一点处变化率最大的方向及其大小,通常用于标量场,表示为向量场。梯度下降算法通过迭代优化,沿着梯度的反方向移动,以最小化目标函数。其基本步骤包括初始化参数、定义损失函数、计算梯度和更新参数。梯度下降算法的变种如随机梯度下降、动量和学习率自适应等,分别解决了内存开销、收敛速度和震荡问题。此外,AdaGrad、RMSProp和Adam等算法通过自适应学习率和动量机制,进一步提高了模型训练的效率和稳定性。选择合适的优化算法对模型性能和训练效率有显著影响。
2025-03-11 14:34:23
349
原创 Apollo8.0 | 场景四:感知激光雷达功能测试 | 使用 mainboard 方式启动激光雷达模块 「失败」
步骤五:模块运行打开浏览器输入 localhost:8888 地址出现 DreamView 页面,选择正确的模式、车型、地图。包-dreamview2.png点击页面左侧状态栏 Module Controller 模块启动 transform 模块:包- transform.png。
2023-03-01 15:55:11
888
5
原创 Apollo | ‘https://apollo-pkg-beta.cdn.bcebos.com/neo/beta bionic InRelease‘ doesn‘t support archite
只需要在 apt/ 下载源中对应的源中 deb 后面添加 [arch=amd64] 即可。找到Apollo8.0中安装教程。repository 不一样。
2023-02-28 19:06:36
3922
1
原创 Ubuntu 系统 apt, dpkg 命令使用详解
https://cloud.tencent.com/developer/article/1484940
2023-02-09 15:40:41
293
原创 【Ubuntu18.04离线安装网卡驱动】自带r8169安装r8125有线网卡驱动
安装Ubuntu18.04.6后 没有网络连接发现:有线网卡是8125而自带的驱动型号为r8169猜测:网卡固件型号和驱动版本不匹配。
2023-02-06 16:32:32
3611
原创 为什么图像预处理要用ImageNet的均值mean和方差std进行归一化?
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
2022-11-17 12:28:24
2581
原创 Pytorch模型model&data.to(device) | .cuda | .cpu()
输出若是True,则model在gpu上;若是False,则model在cpu上。输出gpu则在gpu上,输出cpu则在cpu上。device自己定义好,可以是cpu或者gpu。
2022-08-04 11:31:42
3332
原创 Dropout 和 Drop Path
前言】DropPath是NAS中常用到的一种正则化方法,由于网络训练的过程中常常是动态的,DropPath就成了一个不错的正则化工具,在FractalNet、NASNet等都有广泛使用。
2022-07-27 16:53:34
1035
原创 module ‘cv2‘ has no attribute ‘createTonemapDurand‘
该算法基于将图像分解为基础层和细节层。使用称为双边滤波器的边缘保留滤波器获得基础层。sigma_space和sigma_color是双边滤波器的参数,分别控制空间域和颜色域中的平滑量。请在导入cv2的地方发布代码并调用函数。如果要查找某些函数、属性或其他内容,请查看包的文档或使用dir()和type()。安装opencv3.4.2与对应的opencv-contrib库。opencv3.4.2以上的opencv设计专利问题,有一些函数无法使用。cv2中似乎没有createTonemapDurand函数。...
2022-07-26 09:06:20
1424
原创 End-to-end high dynamic range camera pipeline optimization
RobidouxN,CapelLEG,SeoD,etal.End-to-endhighdynamicrangecamerapipelineoptimization[C]//ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPatternRecognition.20216297-6307.
2022-07-21 18:38:51
293
Office_Tool_v8.2.zip
2021-06-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人