- 博客(11)
- 收藏
- 关注
原创 Human-to-Robot Embodied Learning from Multi-SouRce Motion Data for MobilE DexterouS Manipulation
剖析核心痛点:独立同分布假设的失效量化先前方法的瓶颈:错误的级联放大。
2026-03-16 16:53:39
541
原创 Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning
本文提出ManiWhere框架,解决机器人视觉运动控制中硬件设置易影响策略表现的问题。现有方法多聚焦单一泛化类型且训练不稳定。本框架通过多视角表征学习捕捉共享语义信息,结合STN模块增强视觉鲁棒性,并采用课程式域随机化稳定强化学习训练。实验表明该方法能实现零样本迁移,有效应对多种视觉泛化挑战。创新点在于统一处理样本级、分布级、域级等多层次泛化问题,为机器人视觉控制提供了更通用的解决方案。
2026-03-16 16:48:07
385
原创 【新手入门推荐——手搓Transformer】
本文分享了Transformer模型的代码实现笔记,作者在准备研究生材料时重新研读了Transformer理论并手写了实现代码。代码完整实现了Transformer核心组件,包括:1)编码器-解码器架构;2)多头注意力机制;3)位置编码和前馈网络;4)残差连接和层归一化。作者特别强调了理解细节的重要性,建议通过实践编码来深入掌握模型原理,而不仅依赖视频讲解。代码注释详细解释了各模块功能,如EncoderLayer实现"多头注意力+前馈+残差+归一化"的完整流程,为学习者提供了有价值的参考
2026-03-09 16:33:38
29
原创 Visual Point Cloud Forecasting enables Scalable Autonomous Driving 论文方法讲解
本文提出ViDAR模型,通过视觉点云预测任务实现自动驾驶预训练。该方法利用历史视觉输入(图像-LiDAR序列)预测未来点云,同时学习语义、3D几何和时序信息。ViDAR包含三个核心组件:历史编码器(提取BEV特征)、潜在渲染算子(解决射线特征问题并建模3D几何空间)和未来解码器(自回归预测点云)。与传统方法相比,ViDAR通过条件概率加权机制增强特征区分度,有效提升了下游任务性能。实验表明,该模型能准确理解3D环境,为感知、跟踪和规划提供统一特征表示。相关代码和论文已开源。
2026-01-14 11:47:41
627
原创 One Model for ALL Tasks : Leveraging Efficient World Models in Multi-Task Planning论文部分讲解
针对多任务强化学习中世界模型面临的梯度冲突和模型塑性损失问题,提出了ScaleZero解决方案。通过引入专家混合架构(MoE)缓解梯度冲突,并设计动态参数缩放策略(DPS)实现自适应容量分配。实验表明,该方法在Atari基准测试中显著提升性能,减少28.5%的环境交互。研究创新性地建立了模型退化与学习动态的关联,为多任务规划提供了有效的架构优化思路。
2026-01-12 11:06:26
717
原创 关于AI Agent的入门级操作——(超超超详细版)
目前跟着学长也重新做了一个项目,入门级AI Agent,然后也写了一些文档方便大学生学习和自己也做一个记录吧。感觉大学有用的全是自己学的说是。。。11.23——目前没有排版,主要是先得往后学,可能之后有时间我排个版。
2025-11-23 14:30:30
863
原创 跟着研究生复现Github项目Mononav
结果会出现下载github的Zoedepth项目的文件,大约1.13G左右,所以你不翻墙是肯定会报错的!而且大二的事也太多了。光看这个课外问题,导致了这几天作业也没写,理论力学是真的南。遇到这种抽象问题,我也是栽跟头了,花了很久的时间,没有找到合适的方法去解决,也是因为一直问AI,导致了问题解决的不好。在经历了一周的挣扎,终于完成了Mononav的数据集复现。前提:我已默认你已经完成了miniconda和conda的最新版的安装。要不是研究生学姐之前复现过,提供了很多的帮助。可以忽视并接着完成下面的操作。
2024-10-29 19:29:28
623
原创 Mononav自动规划路径无人机——流程一
OK,一年一度的科创项目又开始了,内卷模式启动!!!这是一个在Github上的项目,目前好像关注的人不多,却是一个非常好的练习路径规划的项目!先叠个甲,我的电脑是系统盘安装Ubuntu20.04,拯救者R9000P。
2024-10-23 14:22:34
462
1
原创 关于跟随博士生做velodyne激光雷达的调试
在装PCL和ceres solver时,总是遇到一些问题(OpenCV出错等),经过几天后才发现,原来是版本过高或者过低导致的不兼容。(导致我课程的进度大大减慢。。。。所以说大家要做一个时常更新博客的作者,浅浅批评一下博士。
2024-09-28 20:29:45
1177
原创 Python 数据库(numpy,pandas,matplotlib)学习笔记
由于目前学校课程所需,学习python数据库,但学校讲的方式失去逻辑且过快,自己也就稍微整理了一些(可能偏向于新手和考试编程一类)。
2024-09-28 11:04:44
587
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅