自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(298)
  • 收藏
  • 关注

原创 IPPO 介绍

IPPO,恰好就是我们上一轮讨论中,用来在Gazebo里训练机械臂的那个“改进版PPO”的核心算法。它是由荷兰格罗宁根大学的研究人员专门为解决6自由度机械臂在复杂、非结构化环境中的运动规划难题而提出的。简单来说,IPPO不是一个全新的算法,而是对标准PPO算法进行的三项针对性改进,让它特别适合机械臂的避障与轨迹规划任务。

2026-03-20 14:19:57 6

原创 gazebo 中通过ppo 进行机械臂轨迹规划

理论基础:IPPO论文提供了完整的算法改进方案工具支持:gym-gazebo2和Stable-Baselines3提供了开箱即用的实现实战路径:先PyBullet快速训练 → 再Gazebo高保真验证 → 最后真实机械臂部署关键成功因素精心设计的状态空间(加入障碍物几何距离)合理的奖励函数(平衡距离、碰撞、限位)采用Sim-to-Sim迁移加速训练。

2026-03-20 14:17:32 106

原创 gazebo 中通过sac 训练机械臂进行轨迹规划

这是将仿真环境与SAC算法对接的关键。要素定义方法(参考案例状态空间State包含三个部分:1.关节状态:当前机械臂各个关节的角度(θ)和速度(v)2.目标位置:深度相机获取的目标螺栓的欧式坐标(p)3.终点坐标:最终期望到达的目标坐标(t)动作空间Action6轴机械臂的连续控制信号。通常为6个关节的目标角度增量或扭矩,记为奖励函数Reward奖励函数是引导智能体学习的关键。一个有效的设计思路是:F$$其中是终点坐标,是当前末端坐标。

2026-03-20 14:09:51 116

原创 OLOv11 + 深度相机的方案实现高精度3D定位

YOLOv11 + 深度相机的方案提供了一个开箱即用的高精度3D定位框架。技术成熟:从模型导出、硬件驱动到坐标计算,都有完整的开源方案支持。精度高:在近距离(0.5m内)可达到毫米级定位误差。速度快:优化后可轻松达到实时(30+ FPS),甚至在高端GPU上超过100 FPS。

2026-03-20 14:03:27 97

原创 【无标题】

Gazebo中使用PPO训练机械臂是一个复杂的系统工程。我来提供一个完整的、可操作的实现方案,从环境搭建到训练部署。

2026-03-20 13:35:41 247

原创 ppo 训练一个 6轴机械臂作轨迹规划

使用PPO训练6轴机械臂进行轨迹规划是一个复杂的系统工程。基于最新的研究成果,我将为您详细梳理完整的实现框架和技术要点。

2026-03-20 11:10:43 235

原创 PPO智能体参数详解与调优指南

训练智能体 = 调整这些参数找到最佳组合!hidden_dim= 发动机大小(动力)= 油门灵敏度(反应速度)eps= 转向限制(稳定性)epochs= 练习次数(经验利用)gamma= 视野远近(规划能力)

2026-03-20 09:28:17 226

原创 PPO算法第5部分:完整训练与测试流程详解

PPO代码的第5部分,包含训练循环、测试评估和主程序逻辑。

2026-03-20 09:20:45 330

原创 PPO (Proximal Policy Optimization) 算法模块详细拆解

重要性采样:用旧策略收集的数据更新新策略裁剪目标:限制更新幅度,保证稳定性GAE优势估计:平衡偏差和方差多epoch更新:提高样本效率Actor-Critic架构:同时学习策略和价值。

2026-03-20 09:15:52 296

原创 PPO 示例

状态空间(4维):小车位置、小车速度、杆的角度、杆的角速度动作空间(2维):向左移动(0)、向右移动(1)目标:尽可能长时间保持杆子直立,每坚持一步得1分,最多500分终止条件:杆倾斜超过15度或小车超出边界pythonclass PolicyNet(torch.nn.Module): # 策略网络:决定要做什么动作# 输入:状态 -> 隐藏层 -> 输出:动作概率分布class ValueNet(torch.nn.Module): # 价值网络:评估当前状态的好坏。

2026-03-20 09:02:44 290

原创 PPO训练小车

用 Gazebo+ROS 搭建 TurtleBot3,定义观测(激光 / 图像)、动作(线速度 / 角速度)、奖励函数(避障 + 进度)。或用 MetaDrive 做自动驾驶仿真,动作空间为连续(转向 + 油门)。python运行# 设备配置# Actor网络:输出动作概率# Critic网络:输出状态价值。

2026-03-19 15:03:29 325

原创 ROS2 中使用ppo 进行路径规划

在ROS 2中使用PPO进行机械臂路径规划是一个系统工程,关键在于将ROS 2的机器人控制接口与RL的训练循环无缝对接。对于初学者,建议严格遵循上述步骤,从Gazebo仿真开始,并使用Stable-Baselines3作为RL库,这是目前资料最多、最稳妥的路径。对于进阶用户,可以探索将PPO与MoveIt 2结合,或者引入更复杂的网络结构(如LSTM)来处理部分可观测的环境。

2026-03-18 16:44:31 273

原创 PPO 训练一个机械臂

从搭建仿真环境开始,精心设计PPO智能体的“大脑”,然后借助各种先进的改进算法进行高效训练,最后攻克Sim-to-Real的难关,将智能部署到真实世界。

2026-03-18 16:30:01 133

原创 PPO 进行机械臂轨迹规划

总的来说,PPO完全可以胜任机械臂轨迹规划任务,尤其擅长应对不确定性高的动态环境。它提供了一种不同于传统方法的解决思路。不过,PPO也并非万能,它的成功应用依赖于高质量的训练环境、精细的奖励函数设计以及针对具体任务所做的算法改进。

2026-03-18 14:38:18 325

原创 MPC 与PPO SAC 的关系

总而言之,MPC、PPO和SAC的关系已经超越了简单的竞争,走向了深度互补。如果你的任务模型精确、约束明确、安全性要求极高(如工业生产线上的重复作业),基于模型的MPC是稳妥可靠的选择。如果你的任务环境复杂、动态难以建模,但允许大量试错(如游戏AI、仿真环境下的策略学习),无模型的PPO或SAC是强大的工具。其中,SAC在样本效率和随机环境中可能更具优势。如果你的任务既需要保证安全,又需要适应复杂的不确定性(如自动驾驶、空间机器人),那么将两者结合的混合方法。

2026-03-18 14:32:52 320

原创 MPC 进行轨迹规划

通过MPC(模型预测控制)实现机械臂的路径规划,核心思想是利用机械臂的动力学模型,在一个内在线求解一个考虑多种约束的优化问题,从而生成最优的关节运动轨迹。与传统的几何路径规划方法不同,MPC直接考虑了系统的动态特性和物理限制,能生成且的运动。我将从核心原理、关键技术路线和典型应用案例三个方面,为你系统地介绍如何通过MPC实现机械臂路径规划。

2026-03-18 14:17:56 338

原创 PPO 在ROS2 中训练与推理

核心流程:构建 ROS 2 Gym 环境(封装状态 / 动作 / 奖励)→ 初始化 PPO 模型 → 与机器人环境交互训练 → 保存模型并推理部署;关键难点:合理设计奖励函数、确保 ROS 2 状态 / 动作的实时性、准确的运动学求解;落地建议:先在仿真环境(如 Gazebo)中完成训练,再迁移到真实机器人,逐步调优奖励函数和超参数。按此流程,你可以快速在 ROS 2 中实现机械臂的 PPO 训练,适配你的 collaborativearm 机械臂完成轨迹跟踪、抓取等任务。

2026-03-17 17:16:37 306

原创 MoveIt可视化配置

cd ~

2026-03-16 16:17:20 30

原创 humble ppo 训练脚本

核心逻辑:PPO 通过学习关节力矩策略,将机械臂状态(关节角 / 速度 + 末端位置)映射为连续动作(力矩),通过奖励函数引导机械臂到达目标位置。训练关键:GAE 优势计算、PPO-Clip 损失裁剪、熵奖励鼓励探索,是保证训练稳定收敛的核心。部署要点:ROS 2 节点需匹配机械臂控制频率(≥100Hz),添加安全裁剪,仿真训练后再迁移到真机。

2026-03-16 14:04:47 32

原创 PPO控制多轴机械臂

适用场景:复杂环境、动态任务、需要自适应 / 柔顺控制的多轴机械臂(抓取、装配、人机交互)优势:PPO 训练稳定、样本效率高,可端到端学习复杂策略,优于传统 PID/MPC 在非结构化环境选型PPO + 自适应 PID端到端 PPO 力矩控制PPO + 多模态输入。

2026-03-16 14:00:11 295

原创 强化学习算法ppo

新手入门首选 PPO:训练稳定、代码简单、调参成本低,能最快获得正向反馈;无需纠结其他算法:先把 PPO 跑通、理解透,再去学 DQN/DDPG 等,会事半功倍;核心学习方法:先跑通代码看效果,再回头理解原理,避免一上来就陷入复杂公式。

2026-03-16 13:27:07 359

原创 RGB-D camara robot arm get

所以,针对你手头的奥比中光Gemini相机实现方案一:先用YOLO等算法检测目标,再结合深度图计算出物体的三维坐标(X, Y, Z)。这对于实现从传送带或固定平台上的“平面抓取”已经足够了。攻克核心难点:集中精力做好手眼标定。这是将视觉坐标转化为机械臂坐标的关键,ROS等框架中有成熟的工具(如)可以帮助你完成这一步。未来扩展:如果你的任务需要抓取随意堆叠、姿态复杂的物体,就需要引入方案三的思路,研究和实现6自由度抓取检测算法。

2026-03-06 16:00:19 305

原创 FPGA AI 结合清单

AMD(Xilinx)适合模型推理的 FPGA/ACAP,核心是Versal AI 系列(带 AIE-ML)、Zynq UltraScale+(带 DPU)、Alveo 加速卡、Virtex UltraScale+,按场景分档推荐如下(2026 年最新)。适合数据中心、900GB/s CXL 全互联、大模型 / 多模型并发、低延迟推理。适合边缘 / 嵌入式、中小模型、低功耗、快速部署。适合服务器级推理、云原生、快速部署。适合自定义推理架构、超高并行、无 AIE 需求。表格

2026-03-05 18:39:25 370

原创 ROS2 实时控制的隐形杀手:Executor 调度模型

上个月调试一个机械臂控制节点。现象非常诡异:本地测试 5ms 控制周期稳如泰山一上产线偶尔跳到 20ms、30ms极端情况直接急停我们做了所有"标准实时优化":PREEMPT_RT 内核线程 SCHED_FIFO 99mlockall 预分配内存CPU 绑定问题依然存在。最后用 perf 抓火焰图,问题才彻底暴露:控制回调根本不是被系统调度打断,而是被 Executor 串行调度阻塞。

2026-03-03 13:14:50 730

原创 熔池推理原理

熔池图像推理,,属于任务。我直接给你的模型方案,不绕理论。

2026-03-02 16:53:33 273

原创 实时系统程序绑定内核

快速验证用taskset:无需改代码,适合单进程绑定,命令行taskset -c 核编号 程序名即可;精准控制用代码绑定:通过(Linux)/(Windows),可实现线程级精准绑定,适合多 FPGA 推理的多线程控制程序;注意事项:绑定的核编号不能超过系统实际核数,且避免多个关键程序绑定到同一个核导致竞争。

2026-03-02 10:46:17 407

原创 多FPGA 进行模型推理

可行,且是高性能 AI 推理的标准方案PCIe/CXL/Ethernet/ 自定义 MGT必须有,片上 + 片外 + 片间缓存缺一不可多 FPGA 推理:可行,且是大模型加速标配通信:PCIe/CXL/MGT 高速串行存储:片上 BRAM + 片外 HBM/DDR5 必须有你现在需要的是能直接落地的多 FPGA 模型推理切分策略,我会按「易实现→高性能」的优先级,给你 3 类核心策略,每个策略都包含适用场景、切分方法和工程注意事项,你可以直接对应到之前的多 FPGA 架构上。入门首选层级切分。

2026-03-02 10:06:55 954

原创 数据标注工具

用户可以根据项目需求自定义标注界面和标注任务,包括创建边界框、多边形、分类、关键点、文本标签等。这种灵活性使得Label-Studio能够适应不同的标注需求,提高标注的准确性和效率。

2026-02-28 15:17:36 658

原创 视觉定位到机械臂抓取

核心流程:RealSense 获取彩色 + 深度→目标检测(2D)→像素转相机 3D 坐标→手眼矩阵转机械臂坐标→机械臂运动抓取;关键前提:手眼标定必须准确(否则抓取偏移),目标检测需适配物体(颜色 / YOLO);优化方向:用 YOLO 替换颜色检测(适配多物体 / 不规则物体),加力反馈校验抓取是否成功。

2026-02-27 16:20:53 972

原创 双目相机识别位置机械臂抓取

双目相机识别物体位置并引导机械臂抓取,核心是,可实现从 “看到物体” 到 “精准抓取” 的全流程自动化。下面从硬件选型、标定、视觉处理、坐标转换、机械臂控制到完整流程,给出可落地的技术方案。

2026-02-27 16:15:01 1058

原创 docker commit

若想将备份保存为「独立文件」(可拷贝、传输、离线使用),需要在 commit 打包镜像后,再执行 docker save 命令,将镜像导出为 .tar 独立文件,全程步骤如下(直接复制执行,适配你的环境)。• 说明 1:-o 后面是「独立文件的保存路径 + 文件名」,D:\docker\ 是路径(可修改,比如 D:\backup\),ros2_humble_backup_v1.tar 是独立备份文件名(可自定义);步骤 3:将镜像导出为独立.tar 文件(核心步骤,生成可保存的独立文件)

2026-02-26 10:56:57 358

原创 docker 入门2

新建一个文件夹(如),里面创建Dockerfile(内容和之前给的一致)。打开 Docker Desktop,点击顶部的Build(构建)标签。点击,选择文件夹,镜像标签填,点击Build。Docker Desktop 会自动读取 Dockerfile 并构建镜像,完成后在Images中能看到。核心前提:先配置国内镜像加速器,解决网络解析 / 超时问题,这是拉取成功的关键。图形界面操作:通过Images标签搜索 → Pull 按钮,全程可视化,不用记命令。验证要点。

2026-02-25 16:38:13 547

原创 docker 入门

核心问题:Docker 访问官方仓库超时,本质是网络问题,而非命令或镜像本身的问题。关键解决步骤:在 Docker Desktop 的 Docker Engine 中配置国内镜像加速器,重启后重新拉取。验证要点:通过确认加速器生效,再执行命令。

2026-02-25 15:58:41 283

原创 docker 使用GUI ROS2

核心问题是VcXsrv 未关闭访问控制或Windows 防火墙拦截,而非容器内配置;用命令行启动 VcXsrv(带-ac参数)+ 替换为 Windows 实际 IP,能解决 99% 的连接拒绝问题;xeyes能显示 → rviz2 必能启动,反之先排查 VcXsrv 和防火墙。按这个步骤操作,你就能看到 rviz2 的 GUI 窗口了。如果xeyes仍提示,告诉我你的 Windows IP 和 VcXsrv 启动方式,我帮你定位最后一步问题。

2026-02-25 13:57:32 529

原创 docker 镜像备份

Docker 容器创建一个,核心是用命令,我会给你分步讲解操作方法,包括基础备份、添加标签、验证镜像,以及更规范的备份方式(推荐)。

2026-02-25 13:55:27 337

原创 window 下使用docker

基础启动,适合快速验证环境。增强启动:添加 GUI 支持、目录挂载、主机网络,适合实际开发和运行 ROS 2 程序。:需安装 VcXsrv 并设置 DISPLAY 环境变量,才能显示 RViz/Gazebo 等窗口。

2026-02-24 16:52:15 334

原创 昇腾910 与 英伟达5090 对比

NPU(神经网络处理器);英伟达 RTX 5090 是。二者定位、架构、场景完全不同,下面做详细对比。

2026-02-11 16:20:28 713

原创 昇腾910

昇腾 910 是面向的高性能芯片,昇腾 310 是面向的低功耗芯片,二者均基于华为自研,定位与参数差异显著。

2026-02-11 16:15:40 562

原创 将yolov5 封装到FPGA

• 再通过 HLS(高层次综合)工具(如 Xilinx Vitis HLS、Intel HLS),将模型的核心算子(卷积、池化、激活、Reshape 等)用 C/C++ 实现,编译为 FPGA 的 RTL 代码;• 量化:将模型从 FP32(浮点 32 位)量化为 INT8/INT16(整数 8/16 位),甚至二值化 / 三值化,这是 FPGA 部署的核心优化手段(FPGA 对整数运算的资源利用率远高于浮点);

2026-02-11 15:29:47 356

原创 张量数据库的优势与劣势

摘要:张量数据库专为高维张量数据(如AI特征、多媒体向量)设计,在存储压缩比(50%-90%)、相似性检索效率(毫秒级响应)及AI框架兼容性方面具有绝对优势,特别适合推荐系统、多模态检索等场景。但其在传统事务处理、低维数据支持及生态成熟度方面存在明显短板,无法替代关系型数据库。实际应用中建议采用"关系库+张量库"的协同架构,通过唯一标识关联两类数据。选型时需明确业务是否以高维张量处理为核心,避免在传统事务场景中使用。(149字)

2026-02-09 17:57:20 713

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除