- 博客(14)
- 收藏
- 关注
原创 UMI-机器人采集数据的通用框架
摘要: 斯坦福大学提出的UMI(Universal Manipulation Interface)是一种低成本、高效的机器人数据采集框架,通过手持夹持器设计结合视觉-惯性SLAM系统,解决了传统遥操作和视频学习在动态任务中的局限性。UMI采用鱼眼镜头、侧面镜和IMU传感器实现多模态感知,并通过延迟匹配机制(包括相机、执行器、通信延迟的精确估计与补偿)提升策略迁移的稳定性。实验表明,UMI能高效采集复杂操作数据,支持双臂协调等长时序任务,为机器人学习提供了可扩展的通用解决方案。
2025-08-18 00:18:46
2515
原创 从噪声到动作:Diffusion Policy 如何改变机器人学习?
摘要: Diffusion Policy提出了一种基于条件扩散模型的机器人动作生成方法,通过逐步去噪生成连贯的高维动作序列,解决了传统方法在多模态分布、动作时序一致性和训练稳定性上的瓶颈。该框架利用视觉观测作为条件输入,结合Transformer时序建模,在复杂任务中显著优于现有方法。实验表明,Diffusion Policy能高效学习多样化策略,并稳定生成长程动作序列,为机器人控制提供了新的技术路径。 关键词: Diffusion Policy、机器人学习、多模态动作生成、条件扩散模型、时序一致性
2025-08-16 18:37:47
1093
原创 Headless 服务器渲染问题与配置指南
本文介绍了在无头服务器上配置OpenGL和Mujoco渲染的解决方案。主要内容包括:安装基础图形库依赖(如mesa-utils、libosmesa、Xvfb等);比较不同OpenGL后端(EGL、GLX/GLXW、OSMesa)的特点及适用场景;提供Mujoco渲染问题的具体配置方案;总结最佳实践,包括依赖安装、后端选择、环境变量配置等。这些方法可帮助在无头服务器上稳定运行需要图形渲染的应用,适用于仿真、自动化测试等场景。
2025-08-13 16:39:37
1072
8
原创 Mujoco仿真环境下的机器人训练(robosuite+robomimic)
MuJoCo仿真环境在机器人训练中的应用 摘要:MuJoCo作为高精度物理仿真引擎,为机器人控制与强化学习研究提供了高效模拟平台。文章介绍了基于MuJoCo的robosuite框架,展示了从环境配置、机器人建模到强化学习训练的完整流程。通过XML文件可自定义机器人结构与任务场景,结合robomimic等工具实现模仿学习。该方案能显著降低实体机器人训练成本,支持从仿真到现实的策略迁移。
2025-08-13 16:37:19
2109
原创 深入探索 PyTorch 在语音识别中的应用
利用深度神经网络对语音信号进行逐帧音素预测。音素是语音中能够区分单词的最小语音单位。本次任务使用 LibriSpeech 数据集(train-clean-100 子集),其中训练集包含 3429 个预处理音频特征文件,总帧数超过 200 万,测试集包含 857 个文件。本文详细介绍了如何在 PyTorch 环境下完成语音识别任务的各个环节,从数据预处理、特征提取、模型设计到实验比较。
2025-03-03 10:06:06
1358
原创 PyTorch 深度学习博客
我们已经介绍了如何使用 Python 3.9 环境和 conda 虚拟环境安装并运行最新稳定的 PyTorch 2.6.0,并通过简单实例验证了环境配置的正确性。
2025-03-02 16:02:26
806
原创 Ubantu 实现turtlebot3仿真(基于ROS平台和强化学习)
本文聚焦于在Ubantu系统上借助ROS平台实现turtlebot3仿真,并融入强化学习技术。开篇介绍turtlebot3发展历程,其从初代发展至turtlebot3,在硬件和软件方面不断完善,应用领域日益广泛。接着阐述环境准备工作,包括Ubantu系统安装,以及通过fishros一键安装ROS。详细说明turtlebot3仿真配置,涵盖相关软件包安装、Anaconda、ROS依赖包、Tensorflow、Keras等软件安装及机器学习包安装步骤。重点讲的操作。
2025-02-18 20:34:39
1631
原创 智能车竞赛 独轮车平衡控制实战经验
在备战2025年全国大学生智能车竞赛中,我们团队采用成功实现独轮车自平衡控制。本文将系统性分享从环境搭建到算法调参的全链路经验,重点解析独轮车相较于传统两轮车的技术难点与解决方案。
2025-02-02 16:46:53
1470
原创 Docker开启容器管理新时代(Docker教程)
Docker 是一个开源的应用容器引擎,基于并遵从 Apache2.0 协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app),更重要的是容器性能开销极低。
2025-01-31 11:56:20
917
原创 MNIST数据集&手写数字识别
一个基本的框架,你可以根据需要调整模型结构、训练周期等参数来优化性能。TensorBoard是一个非常有用的工具,它可以帮助我们可视化训练过程中的各种统计信息,包括损失函数、准确率的变化趋势,以及权重和激活函数的分布等。
2024-05-06 22:44:59
1175
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅