自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(61)
  • 收藏
  • 关注

原创 【论文精读】OpenVLA:An Open-Source Vision-Language-Action Model

在大规模互联网视觉-语言数据和多样化机器人示范数据上预训练的大型策略,有潜力改变我们教授机器人新技能的方式:与其从头训练新行为,我们可以微调这种视觉-语言-动作(VLA)模型,以获得鲁棒且可泛化的视觉运动控制策略。现有 VLA 大多是封闭的,公众无法访问;先前工作未能深入探索高效微调 VLA 以适应新任务的方法,而这是推广使用的关键。针对这些挑战,我们提出了OpenVLA——一个7B 参数的开源 VLA 模型,在97 万条真实机器人示范数据上训练。

2026-04-30 15:51:39 271

原创 【论文泛读】Deep Reinforcement Learning for Autonomous Driving

维度评分说明创新性⭐⭐⭐☆☆当时的前沿,现在已经有很多改进实用性⭐⭐☆☆☆只在仿真环境,实际应用价值有限完成度⭐⭐⭐☆☆框架清晰,但实验不够充分参考价值⭐⭐☆☆☆对数字孪生项目关联度低推荐程度⭐⭐☆☆☆不推荐深入,除非对自动驾驶控制有研究兴趣论文链接。

2026-04-02 14:09:39 238

原创 【论文泛读】 BEV 感知魔鬼指南:俯视角的诱惑与陷阱

🤯 读完感觉眼睛变成了鸟眼。

2026-04-01 15:59:58 461

原创 【论文泛读】A Comparative Evaluation of Lateral Control Techniques for Autonomous Vehicles

本文对自动驾驶车辆横向控制技术进行了全面的实验对比评估,比较了 5 种主流控制方法:LQR、PID、MFC、SAMFC 和 NLMPC。通过系统性调优和真实车辆实验,提供了关于各控制器在不同驾驶场景下性能表现的客观数据。控制器T1T2T3均值NLMPC-10.0630.0500.0510.055SAMFC-20.0770.0660.1180.087MFC-10.1840.0740.1380.132LQR-10.2390.1460.1280.171PID-1。

2026-04-01 14:38:44 636

原创 【论文精读】AIS Data-Driven Maritime Monitoring Based on Transformer: A Comprehensive Review

全面综述 Transformer 模型在 AIS 数据驱动的海事监控领域的应用,涵盖轨迹预测、行为检测、行为预测三大核心任务,并公开 19,016 艘船舶、6.4 亿条消息的高质量数据集。任务核心方法应用价值轨迹预测生成式/分类式 Transformer碰撞预防、交通管理行为检测阈值法/聚类/自监督异常检测、安全监控行为预测Transformer 状态分类风险预判、航线优化自动识别系统增强雷达功能,提供船舶识别和定位信息。

2026-03-31 17:04:36 302

原创 【论文泛读】Learning to Drive in New Cities Without Human Demonstrations

自动驾驶车辆虽然在特定区域内已实现可靠性能,但迁移到新城市仍然昂贵且缓慢。一个关键瓶颈是:当适应与训练城市在道路几何、交通规则和交互模式上存在差异的新城市时,需要收集大量人类演示轨迹。这篇论文提出了一个突破性方法:NOMAD(NO data Map-based self-play for Autonomous Driving),它仅需目标城市的地图和元信息,就可将驾驶策略适应到新城市,完全不需要该城市的任何人类演示数据!│ NOMAD 工作流程 ││ 1. 使用目标城市地图 + 元信息构建模拟器 │。

2026-03-31 08:45:38 665

原创 百度Apollo平台调研

Apollo自动驾驶平台是一个开源系统,包含四大核心模块:开源软件平台(含感知、预测、规划等算法)、云端服务平台(提供高精地图、仿真测试等)、硬件开发平台(适配多种计算单元和传感器)以及车辆认证平台(解决系统与车辆底盘的适配问题)。该平台通过GitHub开源代码,采用高性能中间件CyberRT,支持多种硬件配置,并提供云端数据服务和仿真测试功能,显著降低了自动驾驶研发门槛和测试成本。

2026-03-30 17:27:10 179

原创 【论文精读】Weakly and Self-Supervised Class-Agnostic Motion Prediction for Autonomous Driving

论文精读

2026-03-30 16:31:01 406

原创 自动驾驶轨迹规划如何转化为 OSQP 求解问题——从 Frenet 坐标系到 QP 公式

本文提出了一种基于Frenet坐标系和OSQP求解器的自动驾驶轨迹规划方法。通过将笛卡尔坐标系下的2D规划问题解耦为纵向(s)和横向(d)两个1D问题,构建二次规划模型。采用OSQP求解器高效处理目标函数(包含平滑性、跟踪误差和终态约束)和各种约束条件(如初始状态、速度限制、车道边界和避障要求)。实验表明,该方法能生成安全舒适的轨迹,并通过热启动技术显著提升求解效率。仿真验证了其在车道保持、变道等场景的有效性。

2026-03-28 21:44:29 397

原创 【论文泛读】OSQP:An Operator Splitting Solver for Quadratic Programs

我们提出了一种基于乘子交替方向法(ADMM)的通用凸二次规划求解器,该求解器采用一种新颖的算子分裂技术,要求在几乎每次迭代中求解具有相同系数矩阵的拟定定线性系统。我们的算法非常鲁棒,对问题数据没有特殊要求,例如不需要目标函数正定或约束函数线性无关。一旦执行初始矩阵分解,该算法可以配置为无需除法运算,使其适用于嵌入式系统中的实时应用。此外,我们的技术是第一种能够可靠地从算法迭代中检测原始和对偶不可行问题的二次规划算子分裂方法。

2026-03-28 14:35:38 302

原创 【论文解读】30B 模型拿下 IMO+IOI 双金牌!Nemotron-Cascade 2 论文完整解读

阅读日期:2026-03-27。

2026-03-27 17:34:16 483

原创 [2603.19008] Hypothesis-Conditioned Query Rewriting for Decision-Useful Retrieval

本文提出了一种基于假设的查询重写方法HCQR,用于提升检索增强生成(RAG)在选择题决策场景中的效果。传统RAG仅使用单一查询检索,偏向主题相关性而非决策有用信息。HCQR通过三步框架:(1)生成初步假设及验证证据,(2)构建三个目标明确的查询(支持假设、区分选项、验证关键线索),(3)检索融合后生成答案。实验表明,在MedQA和MMLU-Med数据集上,HCQR比传统RAG准确率提升5.9%和3.6%,决策有用内容比例从30%提升至73.4%。该方法创新性地将中间假设用于指导检索,确保获取的信息直接服务于

2026-03-27 11:33:41 539

原创 ubuntu22.04 安装 carla-ros-bridge

系统:ubuntu22.04ros版本: ros humblescenario runner版本:0.9.13【这个版本的sr可以适配carla 0.9.13和carla 0.9.14】carla版本:0.9.14。

2025-10-16 10:31:45 778

原创 ubuntu 22.04 carla scenario_runner 0.9.13配置

上述方法在每个终端打开后都要运行一遍,才能配置成功,如果不想麻烦,可以把文件中的export内容添加到~/.bashrc文件后面,就不用每次都运行了。这个环境既是运行carla客户端的环境,也是运行scenario_runner的环境,sr其实也是一个客户端。3.3 运行scenario_runner的手动控制示例,此时会在画面中出现一个前车,你手动控制后车跟随。如果报错,可能是依赖没有安装,使用pip install安装即可。解压到本地文件夹,路径无所谓,但最后需要配置到环境变量中。

2025-10-10 10:30:04 561

原创 openrl安装避坑指南

然后,降级jsonargparse。首先,降级gymnasium。然后就可以成功运行了。

2025-09-24 17:16:59 374 1

原创 autoware.auto demo运行

本文介绍了如何运行Autoware的demo程序。首先需要确保正确安装了地图文件,存放在指定路径下。其次要调整显示分辨率,避免界面闪退。运行命令后,可通过2DPoseEstimate和2DGoalPose设置起始点和目标点,系统会自动规划路线实现自动驾驶和自动泊车功能。最后提醒使用Ctrl+C正确终止程序。

2025-09-10 14:19:46 399

原创 chrono学习(一)

用chrono进行沙土的仿真,首先学习demo_GPU_ballCosim.cpp,这个例子仿真了一些沙土的沉降过程。

2023-08-30 17:16:05 723

原创 如何用四元数表示姿态差

在机器人控制中,经常需要控制末端工具的姿态,如果用欧拉角表示姿态,会出现万向锁的问题,而使用四元数就不会有这个问题,此外四元数求出的姿态差为一个标量,更容易在RL算法中使用。由于一个四元数表示三维空间中的一个刚体的姿态,那么认为。如果当前姿态就是期望姿态,那么旋转角度。,单位四元数还具有以下特性,其中。首先,假设末端工具的姿态为。,这个标量即可代表实际姿态。为单位四元数的共轭。distance,使用。总结以上,为求实际姿态。均为三维单位向量,即。

2023-04-13 10:58:23 3397 5

原创 无模型深度强化学习算法

无模型深度强化学习算法可分为两类:一类是直接根据策略梯度更新策略,获得最优策略;一类是通过奖励函数V或Q来评价策略的好坏,在当前状态下选择动作的策略能使agent/actor获得最大的累计奖励就是最好的策略,actor-critic中actor是根据状态选择动作的策略网络,critic是根据状态/状态+动作评价当前策略优劣的评价网络。

2022-12-05 14:58:43 1297

转载 VREP/CoppeliaSim 界面字体过小问题的解决方法

关于屏幕分辨率的重要说明:如果在高分辨率屏幕上发现文本和图形太小,则可以在Windows上执行以下步骤:1-右键单击CoppeliaSim应用程序exe(可能的位置:C:\ Program Files \ CoppeliaRobotics \ CoppeliaSimEdu),然后单击“属性”。2-在“兼容性”选项卡下3-单击“更改高DPI设置”4-选中“替代高DPI缩放行为”框5-缩放比例--选择“系统”您也可以编辑文件“ system / usrset.txt”,将变量“ hig.

2021-05-27 17:56:56 2757 5

翻译 (四)关节控制

Joint controllers There are many different ways a joint can be controlled. In following section, we differentiate betwen aloosecontroller and aprecisecontroller: aloosejoint controller will not be able to provide new control values in each possible...

2021-05-27 17:30:52 1295

翻译 (三)插件教程

Plugin tutorialThis tutorial describes how to write apluginfor CoppeliaSim. The CoppeliaSim scene file related to this tutorial is located inscenes/tutorials/BubbleRobExt. The plugin project files of this tutorial can be foundhere.这个教程介绍了如何为Coppeli...

2021-05-26 15:55:03 1039

翻译 (二)插件

PluginsA plugin is a shared library (e.g. a dll) that is automatically loaded by CoppeliaSim'smain client applicationat program start-up, or dynamically loaded/unloaded viasim.loadModule/sim.unloadModule. It allows CoppeliaSim's functionality to be ex...

2021-05-26 12:12:54 651

翻译 (一)使用CoppeliaSim内置/其他语言编写代码

Writing code in and around CoppeliaSim使用CoppeliaSim内置/其他语言编写代码CoppeliaSim is a highly customizable simulator: every aspect of asimulationcan be customized. Moreover, the simulator itself can be customized and tailored so as to behave exactly as desir..

2021-05-26 10:30:40 1781

原创 C++极简教程(开发环境设置和类的实现)-环境配置和Hello World

最近在coursera上学了一个C++课程,感觉简直是世界上最简单的C++入门课程了,对于有一定其他语言编程基础的人来说,整个课程非常清晰和流畅。非常推荐这门课程,感谢伊利诺伊大学香槟分校的Wade Fagen-Ulmschneider的这门课,让我觉得C++也不过是门编程语言,没必要从入门到放弃,一周的时间绝对可以简单入门,可以写出正确的代码,编写自己的类,完成自己的一个小程序。课程地址如下:https://www.coursera.org/learn/cs-fundamentals-1#syll

2020-11-13 16:47:05 839

原创 VREP/CoppeliaSim新版本软件下载

国内好像下载不了,搬运下,方便你我他。教育版VREP,最新版本更名为CoppeliaSim,这个版本是CoppeliaSim_Edu_V4_1_0。如有侵权,请通知本人删除。链接: https://pan.baidu.com/s/1R_zq7pYwaVB3vvIw_GBVPw提取码: x3bn...

2020-11-02 16:29:16 2345 11

原创 Coordinate Rotation,the DCM(坐标旋转,方向余弦矩阵)

如图1.2-1所示,当一个向量沿着单位向量按左手定则转动了角度,形成了新的向量,则新的向量可以由下式求得:或者当把上述旋转公式放到一个坐标系中时,其转换为下式:记住:这个公式是把向量沿着单位向量按左手定则转动了角度形成了新的向量。在这儿,为了便于理解,我们定义上述向量都是在二维平面坐标系中,.下面我们来解释这段话:In component form, the new array can be interpreted as the components of a new v..

2020-08-28 11:41:09 1488

原创 2.1 A k-armed Bandit Problem

考虑如下问题:有k个不同的选择(或者说动作)摆在你的面前,你需要不断重复地选择其中一个,每次你选择其中一个之后,会根据你选择的动作给你一个数值奖励,这个数值奖励符合正态分布。你的目标是在经过一定的次数后,比如1000次后,获得的期望奖励之和最大。这就是原始形式的K摇臂游戏机问题,以模拟一种投币游戏机命名,它是只有一个摇臂的,而不是k个摇臂。每次选择一个动作就像拉下游戏机上的某个摇臂(拉杆),奖...

2019-08-29 18:03:26 1336

原创 Powell算法总

这是一种最优化算法,可以用于求解多元方程式的解。1. 预备知识对于任意一个n维非线性函数,若其至少二阶连续可微,则可将其在某一点处,进行泰勒展开,保留其二阶项,写成:略去二次以上高阶项,并将其写成如下形式:若取,则上式变为如下一般形式:注意,其中( 表示 ,其余类似):A为n*n矩阵,b为n*1列向量,c为常量。…(1)…(2)…(3)以上A、b...

2019-07-08 19:05:24 5840 1

原创 TensorFlow入门(一)

1、为什么要用TensorFlow?TensorFlow的作用是让你从诸如“如何读入一堆图片”“如何处理图像的灰度值”“如何归一化向量”这样的细节问题中解脱出来,让你不用担心自己的模型中有各种各样的bug;因此,你可以更关注于建立一个优秀的模型,提升模型的性能,使它的精确度更高,泛化性更好等等。Heavy concepts,light codes.2、TensorFlow的特点为了...

2019-06-04 17:35:40 382

原创 深度学习入门笔记 Day10/15 与学习相关的技巧(二)

一、如何使用Weight Decay权值衰减或者Dropout技术缓解过拟合?过拟合现象是指在训练集中表现优秀,但是在其他未知的数据集上表现很差的现象。由于很多过拟合原本就是因为权重参数取值过大才发生的。Weight Decay权值衰减法是通过最小化权值的二范数,使得所有权值都为最小。如果网络的模型变得很复杂,只用权值衰减就难以应对了。在这种情况下,我们经常会使用 Dropout 方法...

2019-05-25 21:52:09 308

原创 深度学习入门笔记 Day9/15 与学习相关的技巧(一)

一、为什么SGD不够完美1. 在输入参数的系数相差较为巨大的时候,比如:的时候,由于参数变化对于y的影响比参数变化要小得多,那么在更新参数的时候,对于x1的更新就很不明显,虽然上式的最小值明显在处,但是如果选择初始值可能最终收敛到的地方是。2. 学习率对SGD影响也很大,如果选择得过大,可能最终无法收敛;选择得不适合,可能收敛速度很慢;选择得过小,学习效率太低。二、什么是...

2019-05-24 16:23:50 217

原创 深度学习入门笔记 Day8/15 误差反向传播法(二)

一、如何实现加法层和乘法层用代码实现昨天的苹果、橘子问题。这里的layer应该理解为节点,MulLayer是乘法节点的实现,AddLayer是加法节点的实现。对于每个节点声明一个类变量mul_apple_layer = MulLayer() #节点1,乘法节点,苹果单价*苹果个数mul_orange_layer = MulLayer() #节点2,乘法节点,橘子单...

2019-05-23 18:31:44 842

原创 深度学习入门笔记 Day7/15 误差反向传播(一)

辛苦码了好多字,都不见了,破网速。。。不干了,撂挑子了。。。一、什么是计算图?将计算过程用图形表示出来。二、什么是反向传播的链式法则?复合函数求导可以层层求导。三、如何实现乘法和加法的反向传播?...

2019-05-22 16:05:54 289

原创 深度学习入门笔记 Day6/15 神经网络(四)

一、什么是数值微分数值微分就是用求导数近似值的方法。取或其他较小的数,则函数在x点处的导数等于:用python等计算机语言实现时,要注意,并不是越小越好,因为计算机的存储空间有限,32位单精度浮点数可表达的数字范围在-3.40E+38 ~ +3.40E+38之间。例子:,求其在x=1处的导数# 函数表达式def fx(x): return x**2#...

2019-05-21 16:07:23 699

原创 深度学习入门笔记 Day5/15 神经网络(三)

一、可否从数据中自动学习神经网络的权重参数?当然可以,不然学深度学习干啥!神经网络的特征就是可以从数据中学习。所谓“从数据中学习”,是指可以由数据自动决定权重参数的值。深度学习、机器学习的区别:深度学习的优势在于不需要人为挑选特征值。https://blog.csdn.net/eowyn0406/article/details/86690667二、为什么要将数据划分为训练数据和测试...

2019-05-20 16:48:01 438

原创 深度学习入门笔记 Day4/15 神经网络(二)

一、如何使用Numpy数组实现一个权重既定的三层神经网络的前向传播?import numpy as npdef identity_function(x): return xdef init_network(): network ={} network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]]...

2019-05-19 20:53:52 343

原创 深度学习入门笔记 Day3/15 神经网络(一)

一、什么是神经网络,它和多层感知机的区别是什么?神经网络和多层感知机的结构是类似的,区别有两点:1. 多层感知机的偏置b在神经网络结构里变成了一个常数输入1的权重。2. 感知机的激活函数是阶跃函数(在0处不连续),神经网络则使用的是其他连续函数,如sigmoid,ReLU等。二、为什么需要激活函数?激活函数是用来建立输入的加权和(WX)与输出(Y)的关系。三、常...

2019-05-18 16:31:15 289

原创 深度学习入门笔记 Day2/15 感知机

一、感知机是什么?感知机是一种算法,把多个输入信号按一定的逻辑关系进行输出(一个输出),单层感知机公式如下:通过调整权重和阈值,可以用来实现各种逻辑电路。二、如何用单层感知机实现各种逻辑电路?比如或门:设置权重和阈值 w1=0.5,w2=0.5,theta=0.3即可,这个值不唯一,自己试试,无限多种组合方式。# 或门# w1=0.5,w2=0.5,theta=0.3...

2019-05-17 12:35:28 455

原创 深度学习入门笔记 Day1/15

第一章 Python入门 Day1/151.2 Python的安装另外安装了一个Python的IDE:pyCharm经常使用的两个外部库: a. Numpy:用于数值运算 import numpy as np(可以改名) b. Matplotlib:用于绘图 import matplotlib.pyplot as plt(可以改名)--------...

2019-05-16 11:49:09 234

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除