自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

码农三叔

人到中年,突然想学习编程,是不是疯了!@

  • 博客(1949)
  • 资源 (2)
  • 收藏
  • 关注

原创 这本书,把“大模型开发”从玩具变成了工程

你会发现,大模型不再只是一个回答问题的东西,而是一个可以参与任务执行的核心组件。很多内容,要么停留在“讲模型原理”,要么只是教你调几个API写个聊天机器人。它前面的内容很克制,没有陷入大段理论,而是快速把你带进开发环境里。看完之后,你确实“懂了”,但你还是做不出一个真正能用的AI系统。模型的回答,也不再是“听天由命”,而是通过检索增强一步步被约束。真正难的,是数据处理、分块策略、检索质量,以及最终回答的可控性。这些问题,才是决定一个AI项目“能不能用”的关键。

2026-05-08 17:34:01 289

原创 零基础也能吃透大模型!这本实战宝典,带你从入门到落地全通关

《大模型基础、架构与开发实战》是一本系统讲解AI大模型技术的实用指南。全书从基础理论到高阶实战,完整覆盖大模型开发全流程,包括深度学习框架、分布式计算、数据处理等核心技术,并详解BERT、GPT等经典模型的训练与部署方法。通过多个实战项目,如ChatGLM3部署、文生图系统开发等,帮助读者将理论知识转化为实操能力。适合AI初学者、开发者及从业者系统学习,掌握大模型开发核心技能,快速提升竞争力。内容前沿、体系完整、实战性强,是入门和进阶大模型领域的理想教材。

2026-05-08 17:33:04 231 1

原创 MCP技术全解析:打通AI Agent落地最后一公里,实战教程重磅上线

在AI大模型飞速迭代的今天,AI Agent(智能代理)早已成为行业焦点。它能自主思考、执行任务、联动多方工具,彻底颠覆传统AI应用的交互模式,成为企业数字化升级、个人效率提升、智能产品研发的核心突破口。但想要打造好用、稳定、可落地的AI Agent,开发者却屡屡碰壁:工具集成碎片化严重,每个接口都要重复开发;跨工具上下文断裂,任务执行频频中断;权限管控缺失,安全隐患重重;动态扩展能力不足,系统迭代成本极高……这些痛点,成了AI Agent从实验室走向量产的最大阻碍。

2026-05-08 17:32:09 237

原创 告别幻觉!基于 DeepSeek,从 0 到 1 落地 RAG 全栈开发

《RAG技术基础与开发实战——基于DeepSeek》是国内首本深度结合DeepSeek模型的RAG实战专著。全书从基础原理到高级架构,系统讲解RAG全流程技术,包括数据处理、向量检索、文本生成、模型微调等核心模块,并涵盖动态RAG、多模态检索等前沿内容。特色在于:1)全程以DeepSeek模型为核心,提供本地化部署方案;2)包含多个可直接复用的实战项目;3)独家讲解GRPO优化等先进技术。本书适合AI开发者、企业工程师等需要实现大模型落地的技术人员,帮助读者快速掌握构建可靠RAG系统的核心能力。

2026-05-08 17:31:14 245

原创 (2-2)常用传感器与基础原理:激光雷达

激光雷达(LiDAR)是人形机器人环境感知的核心传感器,分为机械式和固态两类。机械式LiDAR通过旋转扫描实现高精度三维建模,测距范围广但体积大、功耗高;固态LiDAR采用电子扫描,体积小、响应快,适合近距离动态避障。两者常混合部署形成多层次感知体系。LiDAR的点云特性(密度、刷新率、噪声等)直接影响机器人的导航、避障和操作精度,需通过多传感器融合优化环境感知能力。合理选择扫描方式和优化点云特性对提升机器人在复杂环境中的稳定性至关重要。

2026-04-01 10:39:54 631 8

原创 (2-1)常用传感器与基础原理:视觉传感器

摘要:本章详细阐述了人形机器人核心传感器的功能原理与应用。视觉传感器(RGB摄像头、双目视觉、深度摄像头)分别实现二维图像采集、三维深度感知及近距离高精度测量;激光雷达提供空间几何信息;IMU用于姿态感知;力觉与触觉传感器支持平衡控制与人机交互。各传感器协同工作,通过多模态数据融合克服单一传感器的局限性,为机器人提供全面的环境感知与运动控制能力,满足复杂场景下的导航、操作和交互需求。

2026-04-01 10:39:03 650 5

原创 (1-3)控制系统基础与人形机器人特点:感知-控制-规划”的一体化趋势

摘要:人形机器人正从实验室走向实际应用,"感知-控制-规划"一体化架构成为核心技术趋势。该架构打破传统串行模式,通过数据共享、决策协同和动态闭环,提升机器人应对动态环境、高自由度运动及复杂交互的能力。其核心特征包括统一数据表征、动态协同决策、端到端优化和异构硬件协同计算。虽然面临多域数据融合、算力平衡、全局优化和鲁棒性等挑战,但随着算法创新和硬件发展,一体化架构将成为推动人形机器人实用化的关键,决定其从技术原型到产品的跨越速度。

2026-04-01 10:38:07 478 4

原创 (1-2)控制系统基础与人形机器人特点:人形机器人控制的特殊挑战

人形机器人控制面临三大核心挑战:1)高自由度与强耦合性,20-30个关节的协同控制带来计算复杂度和动力学耦合问题;2)显著的非线性特征,包括几何、动力学和接触非线性,使系统分析与控制设计复杂化;3)环境接触的复杂性,涉及突变约束、摩擦非线性及多任务耦合。针对这些挑战,需采用分层控制、动力学补偿、优化算法、阻抗控制等策略,结合实时计算与自适应能力,才能实现稳定、精确的全身运动控制。这些特性使人形机器人控制区别于传统工业机器人,构成了其独特的技术难点。

2026-03-31 11:18:55 600 3

原创 (1-1)控制系统基础与人形机器人特点:控制系统基本概念

本章系统阐述了机器人控制系统的基本概念,重点分析了人形机器人控制面临的核心挑战。首先介绍了开环与闭环控制、反馈与前馈控制的原理及特点,指出闭环反馈控制在复杂环境中的优势。随后探讨了人形机器人因高自由度、强耦合和非线性特性带来的控制难题,包括稳定性、鲁棒性和实时性等关键指标。最后从关节级控制到全身协调运动,构建了人形机器人控制系统的层次化框架,为后续深入学习奠定基础。控制系统设计需在模型精度、响应速度和计算资源之间取得平衡,以应对动态环境中的各种不确定性。

2026-03-31 11:17:29 564 1

原创 MCP技术全解析:打通AI Agent落地最后一公里,实战教程重磅上线

在AI大模型飞速迭代的今天,AI Agent(智能代理)早已成为行业焦点。它能自主思考、执行任务、联动多方工具,彻底颠覆传统AI应用的交互模式,成为企业数字化升级、个人效率提升、智能产品研发的核心突破口。但想要打造好用、稳定、可落地的AI Agent,开发者却屡屡碰壁:工具集成碎片化严重,每个接口都要重复开发;跨工具上下文断裂,任务执行频频中断;权限管控缺失,安全隐患重重;动态扩展能力不足,系统迭代成本极高……这些痛点,成了AI Agent从实验室走向量产的最大阻碍。

2026-03-29 18:09:29 1088 3

原创 第三卷:《人形机器人的控制与运动规划》

本文系统介绍了人形机器人控制的理论基础与技术实现,主要内容包括:1)运动学与动力学建模,涵盖正/逆运动学求解、多体系统动力学及接触模型;2)关节级控制与实时系统架构,包括电机驱动、PID调参及安全机制;3)平衡控制与步态生成,重点分析ZMP理论、LIPM模型及步态规划方法;4)全身控制框架,涉及任务优先级管理、接触力优化及轨迹规划技术,并探讨模型预测控制在动态动作中的应用。全文构建了从底层控制到高层决策的完整技术体系,为人形机器人开发提供理论指导。

2026-03-29 17:55:59 480 2

原创 (11-4-04)感知-运动耦合与行为理解:人形机器人沉浸式感知运动协同系统(4)系统测试和部署

本文介绍了机器人行为学习系统的测试与部署工具集,主要包括仿真验证脚本deploy_sim.py和动作可视化脚本plot_action.py。deploy_sim.py支持在IsaacGym仿真环境中加载预训练策略,进行归一化预处理、策略推理和动作执行,实现闭环测试。plot_action.py可读取HDF5格式动作数据,自动绘制各维度动作随时间变化的曲线,便于分析动作规律。系统通过仿真测试和可视化分析,确保学习策略的有效性和实用性。

2026-03-29 17:54:45 258 1

原创 (11-4-03)感知-运动耦合与行为理解:人形机器人沉浸式感知运动协同系统(3)行为学习与策略执行

本文提出了一种基于行为克隆的人形机器人模仿学习方法,采用ACT和CNNMLP两种策略网络架构。系统通过HDF5格式加载机器人状态、图像和动作数据,实现数据归一化、填充和批次采样。训练阶段结合视觉数据增强(颜色抖动、透视变换等)和状态噪声添加,采用L1+KL散度或MSE损失优化模型。实验验证表明,该方法能有效学习视觉感知到动作决策的映射,支持断点续训和模型导出。关键创新点包括:1)多相机图像特征融合;2)动作数据填充处理;3)自适应KL权重调节。该系统为人形机器人操作任务提供了稳定高效的行为学习方案。

2026-03-27 11:15:32 547 1

原创 (11-4-02)感知-运动耦合与行为理解:人形机器人沉浸式感知运动协同系统(2)人形机器人运动控制

摘要:本文介绍了一套人形机器人运动控制系统,基于统一接口协议实现真实硬件与虚拟调试双模式控制。系统包含四个核心模块:(1)Robot协议定义机器人控制接口,提供关节状态读写功能;(2)Dynamixel驱动模块实现舵机底层通信,支持真实/虚拟两种驱动模式;(3)DynamixelRobot类封装高层控制逻辑,处理关节配置、滤波和姿态校准;(4)Agent模块实现动作决策接口,支持单/双机械臂协同控制。该系统通过标准化接口和模块化设计,为人形机器人运动控制提供了灵活可靠的解决方案。

2026-03-27 11:11:55 508 2

原创 告别幻觉!基于 DeepSeek,从 0 到 1 落地 RAG 全栈开发

《RAG技术基础与开发实战——基于DeepSeek》是国内首本深度结合DeepSeek模型的RAG实战专著。全书从基础原理到高级架构,系统讲解RAG全流程技术,包括数据处理、向量检索、文本生成、模型微调等核心模块,并涵盖动态RAG、多模态检索等前沿内容。特色在于:1)全程以DeepSeek模型为核心,提供本地化部署方案;2)包含多个可直接复用的实战项目;3)独家讲解GRPO优化等先进技术。本书适合AI开发者、企业工程师等需要实现大模型落地的技术人员,帮助读者快速掌握构建可靠RAG系统的核心能力。

2026-03-26 11:12:34 596 3

原创 零基础也能吃透大模型!这本实战宝典,带你从入门到落地全通关

《大模型基础、架构与开发实战》是一本系统讲解AI大模型技术的实用指南。全书从基础理论到高阶实战,完整覆盖大模型开发全流程,包括深度学习框架、分布式计算、数据处理等核心技术,并详解BERT、GPT等经典模型的训练与部署方法。通过多个实战项目,如ChatGLM3部署、文生图系统开发等,帮助读者将理论知识转化为实操能力。适合AI初学者、开发者及从业者系统学习,掌握大模型开发核心技能,快速提升竞争力。内容前沿、体系完整、实战性强,是入门和进阶大模型领域的理想教材。

2026-03-26 10:33:52 472 1

原创 这本书,把“大模型开发”从玩具变成了工程

你会发现,大模型不再只是一个回答问题的东西,而是一个可以参与任务执行的核心组件。很多内容,要么停留在“讲模型原理”,要么只是教你调几个API写个聊天机器人。它前面的内容很克制,没有陷入大段理论,而是快速把你带进开发环境里。看完之后,你确实“懂了”,但你还是做不出一个真正能用的AI系统。模型的回答,也不再是“听天由命”,而是通过检索增强一步步被约束。真正难的,是数据处理、分块策略、检索质量,以及最终回答的可控性。这些问题,才是决定一个AI项目“能不能用”的关键。

2026-03-26 09:54:09 430 1

原创 (11-4-01)感知-运动耦合与行为理解:人形机器人沉浸式感知运动协同系统(1)系统配置

本文介绍了人形机器人遥操作与灵巧手控制系统中的关键配置模块。系统通过eleop/constants_vuer.py定义手部关键点索引和坐标变换矩阵,teleop/Preprocessor.py实现人体动作数据的预处理和坐标系对齐,teleop/inspire_hand.yml配置人手到机械手的动作重定向规则。这些模块共同实现了"人类感知动作-机器人执行行为"的高效耦合,包括手部姿态映射、坐标系统一和动作平滑处理等功能,为机器人灵巧控制提供了重要基础。

2026-03-25 11:32:46 428 1

原创 (11-3)感知-运动耦合与行为理解:行为识别与预测

摘要: 行为识别与预测是机器人理解人类与环境动态行为的关键技术。人类行为识别通过感知关键点与动作序列,利用时序模型进行分类,实现安全协作。行人轨迹预测结合历史轨迹与交互建模,使机器人提前规划路径避免碰撞。意图推测则通过多模态感知预测人类目标,调整机器人策略实现高效协作。这些技术共同提升了机器人在动态环境中的自主性、安全性和交互能力,为人机共存奠定基础。

2026-03-25 11:29:35 628 3

原创 (11-2)感知-运动耦合与行为理解:感知驱动的操作动作

摘要: 感知驱动的机器人操作通过视觉、触觉等多模态信息闭环(感知-决策-执行)实现高精度任务。视觉伺服技术(PBVS/IBVS)将目标位姿映射为末端运动控制,结合触觉反馈动态调整抓取力与姿态。双臂协调操作需同步控制手间距离与合力,通过多传感器融合优化运动策略,适应动态环境与柔性物体。该机制为复杂操作任务提供了稳定、安全的闭环基础。

2026-03-24 10:46:23 679 2

原创 (11-1)感知-运动耦合与行为理解:视觉与步态的耦合机制

摘要:本章探讨了人形机器人通过视觉、触觉等多模态感知实现稳定运动与精确操作的方法。主要内容包括:1)视觉与步态耦合机制,通过落脚点选择、动态避障和步态参数自适应实现复杂地形行走;2)感知驱动的操作动作,包括视觉伺服抓取、触觉反馈控制和双臂协调操作;3)行为理解技术,如人类行为识别和意图推测,为人机协作奠定基础。系统采用感知-决策-执行三层闭环架构,通过实时反馈调整确保运动稳定性和操作精度,使机器人具备复杂环境下的自主适应能力。

2026-03-24 10:44:32 532 2

原创 通用AI Agent:从被动应答到主动执行的智能系统全解

《AIAgent架构设计与实现》系统阐述了新一代智能系统的核心技术与工程实践。本书由腾讯T4工程师领衔编写,通过11章内容构建完整知识体系,涵盖感知、决策、执行等核心模块,并创新提出四层架构模型。重点解析了多Agent协作机制、从被动应答到主动执行的能力跃迁等关键技术,辅以智能客服、自动驾驶等落地案例。面向AI开发者、架构师等群体,提供从理论到实践的完整指导,帮助读者掌握构建自主智能系统的核心能力,把握AI技术发展新趋势。

2026-03-22 17:48:14 736 3

原创 破解自动驾驶感知决策难题:智能导航技术与实战指南

《自动驾驶智能导航技术与实践》一书系统介绍了自动驾驶核心技术,涵盖环境感知、行为预测、安全增强和系统优化等模块。该书深入讲解YOLO、DeepSORT等算法原理,并提供可落地的实战案例,包括目标检测、轨迹预测等完整项目代码。作为连接理论与实践的桥梁,本书适合工程师、学生等不同读者,帮助掌握从算法到工程的智能导航全栈技术,推动自动驾驶向更安全高效的方向发展。

2026-03-22 17:46:02 572 2

原创 自动驾驶核心技术:环境感知、路径规划与实时地图导航的全栈实践

《自动驾驶核心技术:环境感知、路径规划和实时地图导航》系统阐述了自动驾驶技术框架,涵盖环境感知(激光雷达、红外/超声波、视觉)、定位建图(SLAM算法、实时地图)、路径规划(静态/动态算法)和实时导航等核心模块。通过理论讲解与工程案例相结合的方式,详细介绍了点云处理、目标检测、SLAM建图、路径规划等关键技术,并提供了可落地的实战项目代码。本书旨在填补算法原理与工程实践之间的空白,为从业者提供从理论到应用的完整技术指南,助力自动驾驶技术从L2向L4/L5级进阶。

2026-03-22 17:40:24 822 2

原创 自动驾驶技术演进:路径规划与行为决策的突破与落地

本书以路径规划与行为决策技术的演进为主线,从早期静态算法(Dijkstra)、中期启发式与全局算法(A*、Floyd-Warshall),到当前动态、无地图算法(D* Lite、RRT系列),再到行为决策技术的迭代(规则驱动→优化驱动→深度学习驱动),层层递进,清晰梳理了各类技术的核心逻辑、适用场景与演进关系,帮助读者构建完整的技术知识框架,理解技术升级的底层逻辑。技术演进的最终目标是工程落地,而路径规划与行为决策技术的落地,面临两大核心挑战:一是算法的实时性与鲁棒性,二是不同场景的适配能力。

2026-03-22 17:37:46 608 1

原创 (10-5-03)大模型时代的人形机器人感知:基于RoboBrain大模型的人形机器人通用智能感知系统(3)模型训练

该文介绍了多模态大语言模型训练脚本train/train.py的核心功能,主要包括:1) 定义了模型、数据和训练参数配置类,支持多模态组件(视觉塔、MLP适配器等)的灵活调优;2) 实现了安全模型保存机制,兼容Zero优化策略和适配器权重保存;3) 提供了Llama2等架构的对话预处理逻辑,包括多模态token处理和训练标签掩码;4) 支持分词器和嵌入层动态调整,合理初始化新增token;5) 标准化多模态数据格式,规范图片token位置并清理噪声。最后展示了模型在机器人动作规划任务中的应用示例。

2026-03-20 12:44:21 585 6

原创 (10-5-02)大模型时代的人形机器人感知:基于RoboBrain大模型的人形机器人通用智能感知系统(2)多模态融合

摘要:该文件实现了基于Qwen的LLaVA多模态大模型统一加载功能,支持纯模型、多模态、LoRA微调和量化推理等多种场景。核心功能包括:模型配置解析、权重加载、LoRA合并、视觉投影模块挂载、Tokenizer扩展(图像token)、显存优化(4bit/8bit)和视觉编码器初始化。通过模块化设计,提供"一行代码即可用"的便捷接口,支持分布式训练日志输出、量化精度设置、LoRA权重合并等特性,为人形机器人项目提供高效的多模态模型加载方案。

2026-03-20 12:42:01 324 2

原创 (10-5-01)大模型时代的人形机器人感知:基于RoboBrain大模型的人形机器人通用智能感知系统(1)构建模型

本文介绍了基于RoboBrain大模型的人形机器人通用智能感知系统。该系统由北京智源人工智能研究院开发,通过多模态大模型(MLLM)实现视觉、语言和动作的智能融合,为机器人提供环境感知、任务规划和操作执行能力。文章重点解析了系统核心模块的实现:1) 视觉编码器(SigLip)负责图像特征提取;2) Q-Former视觉重采样模块压缩视觉信息;3) 多模态语言模型(LLaVA-Qwen)实现语言理解与生成。系统采用模块化设计,包含权重转换、视频处理、分布式训练等工具组件,支持从感知到决策的完整流程,推动人形机

2026-03-19 11:19:23 613 4

原创 (10-4)大模型时代的人形机器人感知:感知与任务规划的联动

摘要:人形机器人实现智能操作需要多模态感知与任务规划的协同。首先通过语言-视觉Grounding将抽象指令映射为具体目标,结合大模型进行任务分解和意图理解,将复杂指令转化为可执行的子任务序列。闭环VLM机制通过实时感知反馈动态调整决策,实现"感知-语义-决策"的完整闭环。这种多模态融合与动态规划方法使机器人能在复杂环境中完成精确操作任务,是语言驱动智能行为的关键技术支撑。

2026-03-19 11:14:21 458 2

原创 (10-3)大模型时代的人形机器人感知:多模态Transformer

多模态Transformer为机器人提供了统一处理视觉、点云、语音和触觉等多源感知数据的架构。通过模态特征编码将异构数据映射到统一空间,利用跨模态注意力机制实现信息互补和语义对齐。该架构支持多头注意力分解和时序建模,能捕捉多层次时空关系。联合Tokenization策略将原始数据转换为离散语义单元,降低计算复杂度。这种融合方法显著提升了机器人在抓取、导航等任务中的环境理解能力和决策鲁棒性,但面临计算开销大、实时性要求高等工程挑战。多模态Transformer为实现语言驱动的智能机器人操作提供了关键技术支撑。

2026-03-18 14:30:27 688 3

原创 (10-2)大模型时代的人形机器人感知:3D大模型与场景理解

摘要:本文探讨了3D大模型与多模态Transformer在人形机器人场景理解中的应用。3D-LLM(如Point-LLM、Polymath、LASER)通过融合点云数据与大语言模型,赋予机器人三维语义理解能力,支持空间推理与任务规划。跨模态查询技术将自然语言映射到点云特征,实现目标定位与动态更新。3D场景图通过节点-边结构整合几何与语义信息,增强机器人对物体关系与功能属性的认知。多模态Transformer统一处理图像、点云、语音等数据,通过注意力机制实现跨模态融合,为复杂任务提供联合表示。Token化策略

2026-03-18 14:27:45 719 1

原创 (10-1)大模型时代的人形机器人感知:视觉-语言模型在机器人中的应用

视觉—语言模型(Vision-Language Model,VLM)通过统一建模视觉与自然语言,使机器人具备“看懂并理解语言”的能力,是大模型时代机器人感知与认知融合的核心技术。VLM不仅能够完成图像识别、目标检测等传统感知任务,还可以直接理解语言指令、进行语义推理,并将高层语义映射为可执行的感知与行动目标,在人形机器人中广泛应用于交互理解、场景认知和任务执行等环节。

2026-03-17 10:53:41 912 5

原创 (9-4)多模态融合理论与方法:不确定性建模

本文研究了机器人感知与导航中的不确定性建模方法,重点对比了卡尔曼滤波族和贝叶斯图优化技术。通过人形机器人非线性运动的模拟实验,分析了经典卡尔曼滤波(KF)、扩展卡尔曼滤波(EKF)和贝叶斯图优化的性能差异。结果表明:KF因线性假设误差最大;EKF通过非线性扩展显著提升精度;贝叶斯图优化利用全局约束实现最优估计。实验采用协方差椭圆可视化不确定性,并对比了各方法的位置误差变化。研究证明,针对不同场景选择合适的建模方法对提高机器人状态估计精度至关重要,为机器人导航与决策提供了理论依据和实践指导。

2026-03-17 10:51:35 746 1

原创 (9-3)多模态融合理论与方法:高层融合

执行后绘制人形机器人高层融合完整可视化图,如图9-3所示,展示了决策层四种方法的决策概率对比(规则型、代价优化等对行走/避障/停止的选择差异)、Transformer的跨模态注意力热力图(视觉/激光等模态的关联程度)与时序注意力热力图(不同时间步的依赖关系)、多模态特征的t-SNE降维区分(单模态与融合特征的分布差异),以及风险递增时的时序决策概率变化(停止概率随风险升高而上升),全面展示了高层融合的决策与特征融合效果。总之,高维多模态Transformer为决策层融合提供了灵活、统一、可扩展的建模框架。

2026-03-16 10:50:02 672 4

原创 (9-2)多模态融合理论与方法:中层融合

摘要:本文探讨了多模态融合体系中的中层融合技术,重点分析了其在SLAM、导航与避障中的应用。中层融合通过统一状态建模和结构化信息表达,实现了多传感器数据的协同估计。在SLAM中采用滤波和图优化方法进行位姿与环境联合估计;在导航避障中通过贝叶斯概率融合和动态障碍跟踪构建代价地图。文中还提供了人形机器人中层融合的Python实现案例,展示了状态估计、约束图优化、障碍概率融合等关键技术的可视化效果,验证了该技术在提升系统精度和鲁棒性方面的有效性。

2026-03-16 10:47:21 557 1

原创 (9-1)多模态融合理论与方法:低层融合

本章系统介绍了机器人与智能系统中的多模态信息融合技术,重点阐述了低层融合中的原始数据融合与特征层融合方法。原始数据融合通过时间同步、空间配准、滤波去噪等关键技术处理异质传感器数据;特征层融合则采用特征提取、对齐及多种融合策略实现高效信息整合。通过人形机器人实战案例,展示了从数据生成到融合处理的全流程,包括ICP配准、加权融合及PCA/MLP等特征融合方法。该技术为构建鲁棒智能系统提供了从数据采集到决策优化的完整解决方案,在SLAM、导航等应用中具有重要价值。

2026-03-15 10:04:01 579 1

原创 (8-4-02)多传感器对齐与时间同步:综合实战:多传感器时空标定系统(2)

本文介绍了一个基于ROS2的多传感器标定可视化交互系统,主要包含三个核心组件: calibration_widget.py:实现单/双激光雷达与相机的标定功能,支持点云投影、对应点选取、标定计算(PNP/RANSAC/LSQ)、位姿微调、结果导出等功能。采用PySide开发交互界面,提供3D点云可视化与参数配置。 dual_calibration_widget.py:专为双激光雷达与相机联合标定设计,支持点云投影到图像、对应点管理、手动标定调整、标定计算与结果展示。通过PySide构建可视化界面,实现多传感

2026-03-15 09:57:09 564 1

原创 别再做“调包侠”!AI模型的底层逻辑,全靠这门“数学语言”撑着

前5章,帮你筑牢基础,打破“公式恐惧”——不搞复杂推导,只讲AI里最常用的线性代数知识:向量、矩阵的定义与操作,向量空间与线性变换,用NumPy实现矩阵运算,甚至教你用矩阵乘法模拟单层神经网络,让你一开始就明白“学这个能解决什么问题”。其实,还真有这样一本书——它不搞空洞的理论堆砌,不玩晦涩的公式推导,而是完全从AI从业者的需求出发,把线性代数的核心知识,拆解成AI场景里的实用工具,帮你彻底吃透“AI里的线性代数”。特征降维的PCA,核心是通过特征值分解,提取数据的核心特征,减少冗余信息。

2026-03-13 11:01:27 1044 4

原创 (8-4-01)多传感器对齐与时间同步:综合实战:多传感器时空标定系统(1)

本文介绍了一个多传感器时空标定系统,用于解决人形机器人中视觉、激光雷达和IMU等传感器的安装偏差和时间同步问题。系统通过数据处理模块(bag_handler.py)实现rosbag数据的高效读取、消息同步和异步处理,支持LiDAR-to-Camera和LiDAR-to-LiDAR等多种标定模式。其中,点云清理模块(lidar_cleaner.py)采用深度插值和极线方向检测技术,有效过滤被遮挡的LiDAR点云数据。该系统能够精确标定传感器外参并校正时间偏差,为机器人感知融合和运动控制提供可靠的数据基础。

2026-03-13 10:57:57 516

原创 (8-3)多传感器对齐与时间同步:机体运动带来的对齐误差补偿

摘要: 机体运动导致的多传感器对齐误差是人形机器人动态环境感知的关键挑战。运动引起的机械振动、采样延迟和动态模糊会破坏标定外参的刚性假设,影响SLAM和融合感知精度。核心补偿方法包括:1)基于运动学模型的关节位姿实时计算;2)利用IMU/编码器数据动态更新外参;3)后处理优化消除点云/图像运动畸变。混合策略结合实时补偿与后处理优化,可有效应对行走、旋转等高动态场景,提升视觉-激光融合的鲁棒性。该技术对实现高精度动态环境感知具有重要工程价值。

2026-03-13 10:52:16 586

文本分类与情感分析算法 数据集

我的专栏《NLP算法实战》https://mp.csdn.net/mp_blog/manage/column/columnManage/12584253中第4章 文本分类与情感分析算法 用到的数据。 文本分类和情感分析是自然语言处理(NLP)中常见的任务,它们可以用于将文本数据归类到不同的类别或者分析文本中的情感极性。在本章的内容中,将详细讲解在自然语言处理中使用文本分类和情感分析算法的知识。

2024-05-22

行为预测算法:基于自动驾驶大模型的车辆轨迹预测系统

是我的技术文章https://blog.csdn.net/asd343442/article/details/137137667的配套源码,LyftModel 是指来自 Lyft Level 5 Research 的一个用于自动驾驶的深度学习模型。Lyft 是一家美国的科技公司,致力于开发自动驾驶技术,他们的 Level 5 Research 部门专注于研究和开发自动驾驶技术。LyftModel 很可能是他们开发的一种用于自动驾驶的深度学习模型,用于实现自动驾驶系统中的各种功能,例如感知、规划、控制等。

2024-05-13

专栏《NLP算法实战》中第9部分《大模型Transformer》的所有配套源码

本专栏深(https://blog.csdn.net/asd343442/category_12584253.html)入探讨了自然语言处理(NLP)的核心算法和实际应用的知识,从基础理论到高级技术,全面展示了NLP领域的最新发展。通过清晰的解释、实用的示例和实战项目,读者将在掌握NLP的同时获得实际项目开发的经验。 Transformer模型是一种用于自然语言处理和其他序列到序列任务的深度学习模型,最早由Google的研究人员在2017年提出,并在NIPS(Neural Information Processing Systems)会议上发表了题为《Attention is All You Need》的论文。在本章的内容中,将详细讲解在自然语言处理中使用Transformer模型的知识。

2024-04-24

斗转星移换图系统(PyTorch+Visdom+CycleGAN)源码

本源码是专栏教程https://blog.csdn.net/asd343442/article/details/138044391的配套资料,在本章的内容中,将通过一个项目的实现过程,详细讲解使用Python深度学习技术实现图像转换功能的过程。本项目的名字为"斗转星移换图系统",能够以指定的图片为素材,将图片中的动物换成不同的装扮样式,例如将普通的一批马换成一批斑马。

2024-04-24

Tensorflow机器翻译系统和PyTorch机器翻译系统

赢粉丝要求,上传我的专栏《大模型从入门到实战》中Tensorflow机器翻译系统和PyTorch机器翻译系统的源码和数据集,完整源码,完整数据集。

2024-03-22

AI智能问答系统的源码资料

本源码和数据是我的专栏《模型从入门到实战》中AI智能问答系统的配套资料,专栏地址是:https://blog.csdn.net/asd343442/article/details/135863785,应粉丝要求,上传源码。

2024-03-15

《基于深度强化学习的量化交易策略》一文的源码

应粉丝要求,需要基于深度强化学习的量化交易策略”系列工程的源代码。本人写作是业余爱好,发源码可能会比较拖沓。以后想办法搞个粉丝群,在群里面发会方便一些。博文地址是:https://blog.csdn.net/asd343442/article/details/135739667

2024-02-29

比特币价格预测系统的项目的源码和数据集

专栏《金融大模型实战》中(11-4)比特币价格预测系统的源码和数据集,专栏地址是:https://blog.csdn.net/asd343442/category_12531576.html?spm=1001.2014.3001.5482,欢迎大家观看,本专栏会持续更新,和大家共同进步学习、

2024-01-13

我的专栏《大模型从入门到实战》2-1到2-3的配套源码,包含数据集

我的专栏《大模型从入门到实战》https://blog.csdn.net/asd343442/category_12541559.html中2-1到2-3的配套源码,包含数据集。本篇介绍了数据集的加载、基本处理和制作方法,欢迎大家关注,我会一直更新下去。

2024-01-11

金融大模型实战:个人专栏《检测以太坊区块链中的非法账户》项目的源码和数据集

个人专栏《检测以太坊区块链中的非法账户》项目的源码和数据集,专栏地址:https://blog.csdn.net/asd343442/category_12531576.html?spm=1001.2014.3001.5482,欢迎大家订阅学习,共同进步

2024-01-11

android网络编程

《android4.0网络编程详解》一书的源码,是1-7章的代码

2013-11-01

工资管理系统 +源码+25000字论文

事业单位工资管理系统,有完整的源码,并有word版本的25000字论文

2013-01-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除