- 博客(218)
- 资源 (2)
- 收藏
- 关注
原创 深入解析HiPPO:如何让神经网络拥有“过目不忘”的记忆力?
文章摘要:HiPPO技术——让AI拥有过目不忘的记忆力 传统神经网络(如RNN、LSTM)在处理长序列时存在"记忆衰减"问题,早期信息会随时间指数级丢失。HiPPO(高阶多项式投影算子)通过数学优化,用固定维度的状态向量压缩整个历史信息,使记忆保留时间从指数级衰减改善为多项式级。其核心是将历史数据视为函数曲线,用基函数投影系数表示,类似傅里叶变换的思想。相比Transformer的平方复杂度,HiPPO在线性复杂度下实现了超长序列记忆(超万步),并具备时间尺度泛化能力。
2026-06-11 11:11:35
158
原创 零阶保持(ZOH)完全解析:从离散点到连续世界的桥梁
文章摘要 零阶保持(ZOH)是连接离散数字信号与连续物理系统的关键桥梁。本文系统解析了ZOH的核心原理与应用: 基本原理:ZOH将离散采样值保持为阶梯状连续信号,解决计算机离散输出与物理系统连续执行的矛盾。 数学本质:通过分段常数假设,推导出精确离散化公式,关键步骤包含矩阵指数运算和积分变换。 实现优势:相比欧拉法等近似方法,ZOH在保持假设下实现精确离散化,具有更好的数值稳定性。 应用验证:通过数值算例对比展示了ZOH方法的精确性,并澄清了常见误解。
2026-06-11 10:35:21
387
原创 手撕Transformer:一个完整的机器翻译实例详解
本文通过机器翻译实例“I love you”→“我爱你”,详细解析Transformer模型的前向传播过程。首先将输入词元转换为512维嵌入向量并添加位置编码,随后通过6层编码器处理,每层包含多头自注意力和前馈网络子层。解码器采用掩码自注意力和编码器-解码器交叉注意力,逐步生成目标序列。整个过程展示了Transformer如何利用注意力机制捕捉序列依赖关系,实现高效并行计算,为BERT、GPT等大模型奠定基础。
2026-04-14 22:56:10
599
原创 STTR算法详解:用Transformer重新定义立体匹配
STTR(STereo TRansformer)是2021年提出的基于Transformer的立体匹配新方法,通过序列到序列匹配范式解决了传统方法的三大困境:固定视差范围限制、遮挡区域盲区和唯一性约束缺失。STTR采用特征提取网络、Transformer匹配模块和上下文调整层三部分架构,引入相对位置编码和熵正则化最优传输实现全局匹配。
2026-04-09 22:32:14
497
原创 深入解析SGM算法:半全局立体匹配的原理与实现
SGM(半全局匹配)算法是立体匹配领域的经典方法,在精度与效率间实现了平衡。其核心思想是通过多方向一维动态规划路径聚合来近似二维全局优化,有效解决视差计算问题。重点在于代价聚合步骤:为每个像素沿8个方向递归计算路径代价,综合数据项和平滑项(P1控制视差渐变惩罚,P2控制跳变惩罚),最终求和得到全局最优解。该方法通过局部信息传播实现全局优化,适用于三维重建、自动驾驶等场景。
2026-04-09 10:07:08
677
原创 LLaVA与BLIP2深度对比:两种视觉-语言融合范式的全面解析
LLaVA和BLIP2是两种典型的多模态大模型技术路线:LLaVA采用简洁的MLP投影器将视觉特征映射到语言模型,通过端到端微调让LLM学会“看”图像;BLIP2则通过Q-Former筛选视觉信息,将压缩后的特征输入冻结的LLM。LLaVA训练成本较高但擅长对话任务,BLIP2效率更高且零样本能力突出。两者在视觉问答、图文生成等任务上各有所长,反映了“端到端学习”与“模块化设计”的哲学差异。
2026-03-23 23:42:55
611
原创 解密Transformer中的Query机制:从BEVFormer、UniAD到BLIP2的跨领域应用
本文深入探讨了Query机制在Transformer架构中的核心作用及其在多领域的创新应用。首先,文章通过会议主持人的类比,解释了Query作为注意力机制"灵魂"的工作原理——通过Query-Key-Value三元组实现信息的按需提取。随后,重点分析了Query在三个前沿技术中的具体应用:在BEVFormer中作为网格化时空探针,实现多视角图像到鸟瞰视图的转换;在UniAD中作为连接感知、预测、规划全栈任务的通用接口;在BLIP2的Q-Former中作为桥接视觉与语言的查询令牌。
2026-03-09 11:15:23
582
原创 Verti-Bench 越野仿真平台完整安装指南
本文详细记录了在Ubuntu 20.04系统上配置Verti-Bench越野仿真平台的完整流程。主要内容包括:系统准备、ROS2 Foxy环境搭建、Miniconda环境创建、Python依赖安装(重点强调NumPy 1.24.0的版本控制)、grid_map编译以及PyChrono的完整编译过程(包含第三方依赖如Blaze、OptiX、tinyxml2等的安装)。文档提供了详尽的命令行操作指南,特别注重关键组件的版本兼容性,为研究车辆在极端地形下的移动性能提供了可靠的高保真仿真环境搭建方案。
2026-03-06 11:07:16
415
原创 OpenEMMA + Qwen2.5-VL-3B-AWQ 完整部署攻略
本文详细介绍了OpenEMMA项目的环境配置指南和适配vLLM推理引擎的代码。
2026-02-24 11:00:43
674
原创 Dropout:深度学习中防止过拟合的“随机失活”艺术
Dropout是一种有效防止神经网络过拟合的正则化技术,其核心思想是在训练时随机关闭部分神经元,迫使网络学习更鲁棒的特征表示。
2026-02-14 10:54:27
1142
原创 深入理解Python切片:从入门到精通的七个层次
本文全面解析Python切片操作的7个层次:1)语法层介绍三种切片写法;2)语义层揭示切片选择元素的逻辑;3)边界层说明索引越界的自动处理;4)内存层对比列表(浅拷贝)和NumPy数组(视图)的不同行为;5)步长层详细讲解正向/反向切片的计算规则;6)扩展层展示字符串、元组等多维切片应用;7)本质层剖析slice对象与数据模型。文章通过大量代码示例和内存图示,帮助读者深入理解这一Python核心特性,特别强调了反向切片和不同数据类型的切片行为差异,是掌握Python切片的完整指南。
2026-02-13 16:17:04
857
原创 PyTorch神经网络训练逻辑:从代码到本质
PyTorch训练循环模板包含四个关键步骤:前向传播计算预测值、损失函数评估误差、反向传播计算梯度、优化器更新参数。整个过程形成"预测-评估-调整"的闭环。训练本质是通过迭代式的"犯错-修正"机制优化模型。理解可分为四个维度:直觉上类似教小孩认字的试错过程;代码实现体现为五步循环流程;数学本质是梯度下降优化问题;工程实现需分离模型、损失函数、优化器和数据加载器的职责。
2026-02-13 15:40:02
1076
原创 Python广播机制:别背规则,理解“对齐”
本文深入解析了Python广播机制的本质和规则。广播通过"虚拟复制"小数组使其与大数组形状对齐,实现高效运算。核心是对齐规则:从右往左比较维度,缺失处补1,维度相等或为1才能广播。文章通过学生成绩加分的例子,形象展示了广播的实际应用,并对比了行向量(k,)和列向量(k,1)的不同行为。同时强调广播不会实际复制数据,而是通过指针步长优化性能。最后提供了debug技巧和常见误区澄清,帮助读者真正理解而非死记规则。广播在深度学习等领域应用广泛,掌握其原理能提升代码效率和可读性。
2026-02-13 14:16:58
804
原创 越野环境自动驾驶状态机:基于TinyFSM的工程实践
摘要: 本文探讨了越野环境下自动驾驶系统采用有限状态机(FSM)的设计实践。针对越野场景缺乏车道线、多变路况等特点,提出基于TinyFSM的状态机解决方案。系统划分8个核心状态(如正常行驶、缓行、涉水、岩石攀爬等),每个状态对应明确责任边界。文章详细展示了事件定义、状态机基类设计,并以正常行驶和脱困状态为例说明实现方法。该架构通过将复杂决策分解为离散状态,解决了端到端方法在越野环境中的数据不足、可解释性差等问题,为自动驾驶系统在非结构化道路上的鲁棒运行提供了工程参考。
2026-02-13 11:18:02
919
原创 PyTorch基本用法介绍:从零开始构建深度学习工作流
本文介绍了PyTorch深度学习框架的核心用法,从基础概念到完整训练流程。主要内容包括:PyTorch的核心抽象(张量、自动微分和模块化设计);张量操作的基本方法(创建、索引和变形);自动微分机制的原理与工程实践(梯度计算与清零);神经网络构建方法(基于nn.Module的模块化开发);以及标准训练循环的实现模板。文章强调PyTorch动态计算图的优势,并提供了从数据加载到模型训练的全流程指导,帮助读者快速掌握PyTorch的基本工作流。
2026-02-13 10:50:49
1697
原创 TinyFSM 使用指南:轻量级C++有限状态机
TinyFSM是一个轻量级C++11有限状态机库,采用纯头文件设计,具有零依赖和高性能特点。该库通过事件驱动状态转换,支持Moore和Mealy两种状态机模型。使用步骤包括定义事件类、创建状态机基类、实现具体状态类、设置初始状态以及事件分发。高级功能包括带条件的转换、多状态机协同(FsmList)和自定义复位。关键注意事项包括:transit必须是反应函数最后一行、避免在entry/exit中转换、事件仅发送给当前活动状态。该库特别适合资源受限或实时性要求高的场景。
2026-02-13 10:45:29
423
原创 VScode中使用Black Formatter调整Python代码排版格式
VScode使用Black Formatter优化Python代码排版
2026-02-13 10:41:38
374
原创 Hybrid A*算法中子节点与父节点存在于同一个栅格时的问题分析与解决
Hybrid A*算法中,当子节点与父节点位于同一栅格时会导致节点KEY值冲突,引发路径回溯失败和节点误关闭问题。原因在于OPEN/CLOSED列表采用栅格坐标作为KEY值,当父子节点坐标相同时会覆盖存储。解决方法包括:调整扩展步长确保跨越栅格、修改父节点指针指向祖父节点,或采用连续位姿作为KEY值。其中调整步长是最直接有效的解决方案,可从根本上避免节点冲突问题。该问题源于Hybrid A*连续空间特性与离散栅格存储方式的矛盾,需在算法实现时特别注意处理.
2025-08-19 14:20:28
927
转载 一行命令解决rosdep update失败问题(kinetic, melodic, noetic)
一行命令解决rosdep update失败问题
2025-08-17 23:29:50
3536
原创 python程序启动ros节点rospy.init_node卡住
由于python代码要同时用到pytorch和ros,因此需要在conda环境里面运行python程序。但是终端运行时,在运行到rospy.init_node时,程序会卡住,不会报错,但是后面的代码不会执行,一直卡住没反应。1.在setting里面点击下拉菜单,点击Python Interpreter的下拉菜单选择“Show All”后面在pycharm里面运行时解决了该问题,不过需要要rospy的路径配置到pycharm里。完成上述操作后,在Pycharm中即可运行代码正常启动ros节点。
2025-03-20 08:33:46
753
原创 解决“Unable to find either executable ‘empy‘ or Python module ‘em‘... try installing the package”问题
解决cmake时找不到python相关库的问题
2025-03-19 16:39:16
1334
原创 解决“E: Sub-process /usr/bin/dpkg returned an error code (1)”报错问题
python3-catkin-pkg这个包一直报错,修复也修复不了,执行下面的代码后就好了。
2025-03-04 00:10:34
1487
原创 解决ros用catkin_make编译时提示“Command ‘catkin_make‘ not found”的问题
虽然提示安装catkin,但是一般而言,并不是没有安装导致的,而是环境没配置对。如果添加了还是不行,那就在终端命令行中手动输入上面的指令,然后再用catkin_make来编译。
2024-11-27 15:14:44
2022
原创 解决“usbhid 1-6:1.0: couldn‘t find an input interrupt endpoint”导致电脑启动不了的问题
启动电脑时,黑屏,显示“usbhid 1-6:1.0: couldn’t find an input interrupt endpoint”sda1换成你的盘,出现提示全部输入y,完成后reboot重启即可。如果sda1不行就是sda6,或者其他数字,出现修复信息就说明对了。屏幕上提示可以用BusyBox的指令进行修复,具体修复方式如下。
2024-11-27 14:54:53
1146
CMU卡内基梅隆大学机器人规划与决策课程课件
2020-05-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1