自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(402)
  • 收藏
  • 关注

原创 Cursor Agent---如何更好地掌控AI编程助手

Cursor是一款受到开发者欢迎的AI编程助手,今天我们来分析它的系统提示词,以便更好地理解它的工作原理,提高使用效率。

2025-06-12 10:00:00 1118

原创 从零理解PID控制:小球仿真到代码实现,手把手教你掌握工业级控制算法

很多人应该都听说过PID,它的运算过程简单,并能在大多情况下实现较好的控制效果,因此它是工程实践中使用最广泛的控制方法之一。抛开公式,我将带你从案例出发,详细了解PID的工作原理和使用方法。注:阅读本文不需要有过多的基础知识,只需中学物理和数学知识就能看懂(当然如果有高等数学知识和单片机知识的话理解起来会更容易)我们假设有一个一维的坐标轴(向右为正方向),在上面上有一个小球(可以看作质点),小球不受任何阻力,可以自由左右滑动;

2025-06-11 10:00:00 1277

原创 具身智能从DRL-robot-navigation学起

在这个数字化和智能化日益加速的时代,机器人技术正在逐渐改变我们的生活方式。是一个非常不错的入门开源项目,它利用深度强化学习(Deep Reinforcement Learning, DRL)让机器人实现自主导航,通过模拟环境训练机器人,使其能够学习如何在复杂环境中有效地移动,避开障碍物并达到目标位置。其核心技术是基于TensorFlow实现的深度Q网络(Deep Q-Network, DQN),这是一种被广泛应用于强化学习的神经网络模型。

2025-06-10 10:00:00 515

原创 基于人工智能的闸机人脸识别门禁系统

Dlib的核心架构融合了图像计算和深度学习的精髓,凭借高效的算法和灵活的模块化设计,在视觉分析任务中展现出了非常优秀的性能,尤其是在精准识别人脸和面部特征方面。Haar图像特征最初是通过对矩形区域进行分析来开发的,它通过计算不同区域之间的灰度对比,能够捕捉到描述物体形态的关键信息。在人脸识别任务中,Haar特征的一个突出特点就是它能够有效抓取面部的关键结构,比如眼睛、鼻子、嘴巴等位置的亮度差异。具体来说,它是通过计算白色矩形区域和黑色矩形区域的像素总和的差值,来表示图像在这些区域内的灰度差异。

2025-06-09 10:00:00 1425

原创 相机雷达外参标定算法调研

相机与激光雷达的外参标定是自动驾驶、机器人等领域的基础工作。精准的标定不仅有助于提高数据融合的效果,还能提升算法的整体性能。随着技术的发展,许多研究者和公司致力于开发高效的标定工具和算法,本文将对无目标标定和有目标标定两种主要的标定方法进行调研。

2025-06-08 10:00:00 578

原创 【MoE】【Qwen3】【1】彻底搞懂Qwen3底层源码

前面我们详细讲解了deepseek MoE的具体代码实现细节,同时指出了Deepseek MoE存在的缺陷和不足。而Qwen3 MoE作为近期的重大新闻,本文也讲解一下Qwen3的具体实现,顺便探讨该模型与DeepSeekMoE模型的区别。本文将讲解Qwen3的核心模块即Qwen3MoeSparseMoeBlock类的代码实现和形状推理。

2025-06-07 10:00:00 1288

原创 DeepSeek 提示词大全

提示词(Prompt)是人类与大语言模型进行交互的指令性文本,它告诉模型"做什么"和"怎么做"。好的提示词能够引导模型产生符合预期的输出,就像巧妙的钥匙能打开精密的锁一样。任务:请对以下{文本类型}进行摘要提取内容:{需要摘要的完整内容}摘要要求:- 长度:{字数或段落要求}- 重点关注:{需要特别提取的信息类型}- 结构:{摘要的呈现结构,如"要点列表"、"段落式"等}- 风格:{摘要的语言风格}- 额外要求:{其他特殊要求}实例应用任务:请对以下研究论文摘要进行提取和简化。

2025-06-06 10:00:00 805

原创 Teller:打破音频驱动动画僵局

积跬步方可至千里,每天都进步一点点。,随着时代的发展,我们对于与虚拟世界的互动体验要求越来越高,当我们和一个虚拟人聊天时,如果它不仅能理解我们说的话,还能根据我们的声音实时做出生动、自然的表情和动作,就像和真人交流一样,那应该挺让人兴奋的哈,Teller就朝着这个方向迈出了重要的一步。

2025-06-05 10:00:00 751

原创 农业植保无人机核心技术从理论到实现

博主近期设计了一种基于STM32的农业植保无人机系统,旨在提高农业作物管理效率,特别是在灌溉作业方面。该无人机具备手动模式和小范围巡航模式,适应不同作业需求。在手动模式下,用户通过遥控器控制飞行状态,适用于局部精准作业;而小范围巡航模式则支持自动飞行,适合大面积农田的常规灌溉。无人机搭载高效喷洒系统,能够调节水量,精确浇灌,避免浪费。系统核心采用STM32单片机,具备强大处理能力和实时控制性能,保证飞行稳定性与安全性。该系统操作简便,适应各种规模农田,特别对大规模灌溉和健康监测有明显优势。

2025-06-04 10:00:00 1716

原创 带你手搓ROS应用之ROS2 与 SCADA 集成

而 SCADA(Supervisory Control and Data Acquisition,监控与数据采集系统)是工业自动化系统的核心,用于采集数据、监控工业设备并执行控制任务。ROS2 与 SCADA 的集成,使机器人能够访问工业自动化系统的数据,实现数据分析、决策优化,并通过 SCADA 远程控制机器人执行任务。本文章将详细介绍 ROS2 和 SCADA 的集成技术,包括通信协议、数据流动、系统架构,并提供完整的代码示例,确保可操作性。连接 PLC 并采集工业数据,如温度、湿度、压力等。

2025-06-03 10:00:00 934

原创 具身智能和人形机器人项目汇总

具身智能(Embodied Intelligence)是指通过物理体(如机器人或生物体)与环境进行互动而获得的智能。这种智能强调身体在认知过程中的重要性,认为智能不仅仅是大脑的功能,还包括身体的感知、运动和与环境的交互。具身智能的研究领域涉及机器人学、认知科学、神经科学等,重点在于如何通过身体的运动和感知来实现智能行为。而人形机器人与具身智能最近两年有效的结合到了一起,并以openloong为首,诞生了很多开源项目。从第一代到第四代的发展,第一代遥控设备,第二代机械臂(工业机器人),第三代移动智能机器人(扫

2025-06-02 10:00:00 1522

原创 ROS应用之如何配置RTOS满足机器人系统中的实时要求

实时操作系统(RTOS)基本概念实时操作系统(RTOS)是设计用于实时应用的操作系统,其主要目标是在确定的时间内完成任务。RTOS的任务调度算法和优先级控制机制能够确保高优先级任务按时完成。精确的传感器数据采集:传感器数据需要在规定时间内采集并传输给控制系统。快速响应外部事件:对于控制系统,需要确保指令在最短的时间内得到响应。任务的调度周期:任务的周期可以通过公式计算,其中 ftask 是任务的调度频率。优先级分配。

2025-06-01 10:00:00 649

原创 宇树机器狗go2添加3d雷达(下)添加velodyne系列雷达

上一篇文章教大家如何在宇树机器狗go2的仿真环境中添加3d雷达livox mid360(宇树机器狗go2 添加3d雷达(上)添加livox系列雷达),本期文章会教大家添加lvelodyne的系列雷达,是添加3d雷达的下期。宇树机器狗go2仿真会作为一个长期项目来进行不定期更新,仿真不只限于在gazebo上实现,后面还会在isaac sim等仿真平台上教大家如何搭建,其目的还是帮助各位都能以较低的成本加入到宇树机器狗go2的学习中。

2025-05-31 10:00:00 663

原创 宇树机器狗go2—slam建图(2)gmapping

上一篇番外文章带大家认识了一下slam中常用的一些点云格式,本期文章会教大家如何让宇树的机器狗go2在仿真环境中使用gnaaping进行2d建图,在后续的slam建图和slam算法解析的时候会经常与这些点云信息打交道。宇树机器狗go2仿真会作为一个长期项目来进行不定期更新,仿真不只限于在gazebo上实现,后面还会在isaac sim等仿真平台上教大家如何搭建,其目的还是帮助各位都能以较低的成本加入到宇树机器狗go2的学习中。

2025-05-30 10:00:00 458

原创 xLSTM技术介绍

各位朋友大家好呀,欢迎大家来到每日前沿技术分享专栏,每日进步一点点,积跬步,才能致千里。见证从量变到质变的成长。今天要分享的是xLSTM技术,看看它到底是怎么让LSTM重获新生的。LSTM自 20 世纪 90 年代诞生以来,就凭借其处理序列数据的强大能力,然而,随着时代的发展和技术的进步,数据量如同滚雪球一般越来越大,任务也越来越复杂。在这样的大环境下,传统的 LSTM 模型也开始有些力不从心了。它在处理长序列和大规模数据场景时,无论是处理能力还是效率方面,都出现了一些局限性。这时候,

2025-05-29 10:00:00 527

原创 exo:打造家用设备AI集群的开源解决方案

exo是一个由exolabs团队维护的开源项目,其核心理念是"在家中使用日常设备运行自己的AI集群"。不同于传统的单一高性能设备方案,exo允许用户将多种设备(如iPhone、iPad、Android、Mac、Linux等)连接在一起,形成一个虚拟的分布式GPU系统,共同完成AI模型的运行任务。想象一下,你可以同时利用家中的笔记本电脑、台式机、平板电脑甚至手机,组建一个个人AI集群,无需额外购买昂贵的专业硬件。这就是exo项目的愿景和价值所在。DiscordTelegramX许可证:GPL v3。

2025-05-28 10:00:00 959

原创 【MoE】【DeepSeekMoE-v1】【2】分布式微调代码详解

由于近期需要微调改后的moe模型,所以需要一套微调代码,之前有用gpt生成代码来训,但总是需要面临分布式训练的问题,而分布式训练的时候又很容易报错,导致极难debug,因此为了简单方便,直接使用DeepSeek官方给出的finetune框架,并学习该框架,从而为己所用。【MoE】【DeepSeekMoE-v1】【1】分布式微调代码详解】:讲解了模型推理代码的原理以及官方微调代码的整体设计和结构。本文会继续讲解各个函数的内容。

2025-05-27 10:00:00 637

原创 ROS应用之软体机器人的控制与仿真

软体机器人(Soft Robots)采用柔性材料和可变形结构,具有高度的灵活性和适应性,能够在复杂环境中执行任务。与传统刚性机器人相比,软体机器人能够通过形状变形而非传统的关节和驱动器来实现运动,这使得它们在医疗、探索、搜救等应用中展现了巨大的潜力。ROS(Robot Operating System)是一个开源的机器人操作系统,提供了多种工具和库,可以有效地实现软体机器人的建模、控制和仿真。通过ROS,软体机器人能够实现与环境的交互、复杂运动的控制,以及仿真验证。

2025-05-26 10:00:00 622

原创 动手学AI 第二部分第三节 —— 主流的卷积神经网络(下)

各位同学大家好,欢迎来到动手学 AI 专栏!在上一篇文章《动手学 AI 第二部分第二节 —— 主流的卷积神经网络(上)》中,我们一起学习了 AlexNet、VGGNet、GoogleNet 和 ResNet 这几种主流卷积神经网络,相信大家对卷积神经网络已经有了更深入的理解:那么在这篇文章中,咱们接着探索另外几种同样具有代表性的卷积神经网络,看看它们又有哪些神奇的地方!

2025-05-25 10:00:00 313

原创 使用 Docker 和 Docker Compose 安装与运行 ROS 1 CUDA教程

Docker是一种轻量级虚拟化技术,用于将应用及其所有依赖打包成容器,保证在任何环境中一致运行。是 Docker 官方提供的多容器编排工具,通过一个 YAML 文件定义多个服务的配置,简化多容器应用的启动与管理。Compose 主要解决了多容器应用的配置和部署问题。

2025-05-24 10:00:00 1027 1

原创 OrangePi Zero2开发指南:从SDK获取到交叉编译全流程详解

SDK 全称 Software Development Kit,即软件开发工具包。一般包括了一些工具(如交叉编译工具链)、库、文档和示例代码。香橙派的Linux SDK其实指的就是 orangepi-build 这套代码集,orangepibuild 在脚本和配置文件中会指定 u-boot、Linux内核和交叉编译工具链的地址,运行 orangepi-build时,当其发现本地没有这些东西,会自动去相应的地方下载的。使用 orangepi-build 可以编译出多个版本的 Linux 镜像。

2025-05-23 10:00:00 1302

原创 【机器学习】入门指南:西瓜书第1章绪论(上)【理论到实践】

机器学习是一门研究如何通过计算手段,利用经验(通常以数据形式存在)来改善系统自身性能的学科。其核心目标是让计算机从数据中学习规律,并对未知数据进行预测或决策。例如,给定一组西瓜的特征数据(如色泽、根蒂、敲声),通过机器学习方法训练模型,判断新西瓜是否成熟。

2025-05-22 10:00:00 838

原创 每日代码解读专栏:OpenVLA(Action)部分的解读

OK。我们今天继续来进行OpenVLA的解读。那么今天,我们将会来进行Action生成部分的解读。也就是说,它是通过训练VLM,进而如何生成Action的。这里面有什么需要注意的地方。那将会在我们今天这篇文章中给大家一一阐述。我们实际上是话接上文了哈,在上篇文章中,我们是说到了OpenVLA的视觉部分。那么在本篇,我们将会带领大家详细地看一看有关于其Action部分的生成的内容。其实可以看到,这个代码文件并不长,函数也并不多(相较于我们之前所说过的那些来说)。因此,理解起来也没有像之前的那样繁琐。

2025-05-21 10:00:00 500

原创 智能家居全栈开发实战:语音控制+人脸识别+安防监控完整方案

人脸识别使用阿里SDK支持Python和Java接口,目的是复习巩固智能分类时引入C语言的Python调用此接口是人工智能接口,阿里云识别模型是通过训练后的模型,精准度取决于训练程度,人工智能范畴在常规嵌入式设备负责执行居多,说白的嵌入式设备负责数据采集,然后转发给人工智能识别后,拿到结果进行执行器动作。

2025-05-20 10:00:00 862

原创 代码实战——由二维的RGB相机图像构建3维的点云

各位同学大家好啊,欢迎来到代码实战专栏。理论与实际结合,才可以进步得更快!那接下来就开始我们今天的代码解读吧。具身智能和图像处理这两个领域有一个很明显的差异就是一个是处理2D的信息,一个是处理3D的信息。所以,学会如何从2D转化成3D的信息非常重要。它是SpatialRGPT里面的一段代码。实际上也是它拿数据的第一段——将二维的RGB图像转化为三维的带有深度信息的点云。。因为要全说的话肯定就不够深入了hh,所以我们就专挑核心的来说。那process函数的主要目的,

2025-05-19 10:00:00 922

原创 基于YOLOV8的疲劳驾驶系统设计

YOLOv8的设计通过许多技术创新,进一步提升了目标检测性能,特别是在处理复杂场景与多目标检测时,展现了出色的能力。与传统的局部注意力机制不同,GAM可以捕捉长距离的依赖关系,考虑全图的上下文信息,从而帮助模型在处理特定区域时更加准确地识别重要特征。而YOLOv8通过创新的特征融合技术,增强了其在不同尺度上的检测能力,能够准确识别从微小物体到大物体的各种目标。其主要优势在于通过动态调整特征的权重,能够加强对长距离依赖的建模,提升对复杂场景的识别能力,并增强模型的鲁棒性,特别是在噪声或遮挡的情况下表现更佳。

2025-05-18 10:00:00 681

原创 并发与顺序处理在API请求中的应用:以Python为例

在现代软件开发中,API(应用程序编程接口)已经成为连接不同系统和服务的核心工具。无论是获取实时数据、调用外部服务,还是与人工智能模型交互,API都扮演着不可或缺的角色。然而,当我们需要处理大量API请求时,如何高效地完成任务成为了一个关键问题。本文将通过一个Python示例,深入探讨并发处理与顺序处理在API请求中的实现与应用,并结合技术背景、代码分析和实践场景,提供全面的解读和建议。本文的目标是帮助读者理解这两种处理方式的优缺点,并在实际项目中做出明智的选择。

2025-05-17 10:00:00 415

原创 动手学AI 第二部分第二节 —— 主流的卷积神经网络(上)

以及优缺点分析。

2025-05-16 10:00:00 742

原创 一篇图文详解PID调参细节,实现PID入门到精通

在工程中,如果我们要用单片机做一个温控系统,其系统组成一般如下:一个采集温度的ADC,一个输出温度的加热头以及一个用于运行控制算法的单片机,如果我们要维持温度为100度,在不加任何控制算法的情况下,我们可以通过简单的阈值判断法实际曲线(黑线) 在 目标曲线(红线) 周围抖动那如何才能维持实际曲线与目标曲线贴合,达到一个稳定的控制效果呢?这里就引入了PID控制算法的概念,PID是 Proportion Integration Differentiation 的缩写,实际上他就是一个公式,由。

2025-05-15 10:00:00 835

原创 香橙派智能垃圾分类系统全攻略:摄像头配置+语音控制+阿里云AI识别

点击香橙派智能垃圾分类系统全攻略:摄像头配置+语音控制+阿里云AI识别查看全文。

2025-05-14 10:00:00 808

原创 【MoE】【DeepSeekMoE-v1】【1】彻底搞懂核心代码与公式

由于近期需要改DeepSeekMoE的结构,因此没办法,还是要手搓源码,顺便记录一下笔记,会对一些结构的形状推导、函数用法以及论文公式推导(包括这些公式对应哪些代码)进行详细解释待讲完DeepSeekMoE核心代码之后,如果有机会的话会讲一下怎么修改结构并进行训练的(不过这部分出教程概率不高,因为对模型架构底层源码的理解要求太高了。。由于本文对每一行代码剖析的特别细致,难免篇幅过长,且本文结合了很多大佬的精华,即便没有任何基础的AI初学者也能够看懂!

2025-05-13 10:00:00 839

原创 Dense 与 MoE 系列模型架构的全面对比与应用策略

人工智能领域正经历着一场架构革命,从。本文将全面剖析这两种模型架构的本质差异、各自优势与挑战,并提供战略性的选择框架,帮助读者在实际应用中做出明智决策。

2025-05-12 10:11:05 1043

原创 ResCLIP技术,CLIP技术的变种

今天我们要分享的是ResCLIP这项技术,。今天我们就来一起学习一下ResCLIP这项技术吧。

2025-05-11 10:00:00 770

原创 jetson orin nano super AI模型部署之路(五)tensorrt C++ api介绍

我们基于这个仓库介绍。这个仓库的代码是一个非常不错的tensorrt的cpp api实现,可基于此开发自己的项目。我们从src/main.cpp开始按顺序说明。

2025-05-10 10:00:00 661

原创 【MoE】【DeepSeekMoE-v1】【1】分布式微调代码详解

由于近期需要微调改后的moe模型,所以需要一套微调代码,之前有用gpt生成代码来训,但总是需要面临分布式训练的问题,而分布式训练的时候又很容易报错,导致极难debug,因此为了简单方便,直接使用DeepSeek官方给出的finetune框架,并学习该框架,从而为己所用。

2025-05-09 10:00:00 1947

原创 宇树机器狗go2——添加3d雷达(上)添加livox系列雷达

上一篇文章教大家如何在宇树机器狗go2的仿真环境中添加2d激光雷达、单目相机、深度相机(宇树机器狗go2仿真添加2d雷达和深度相机),本期文章将urdf文件中有关radar的描述迁移到xacro文件中并加入一个3d激光雷达进行匹配(会添加livox的mid360和velodyne的系列雷达,分别在上下期)。

2025-05-08 10:00:00 1281

原创 3D Gaussian Splatting部分原理介绍和CUDA代码解读(六)——高斯协方差投影与求逆的反向传播

这篇综述的也有详细介绍3D GS的方法。(本系列文章介绍的代码均在此repo内);本文介绍的代码若未单独说明,均位于中。

2025-05-07 10:00:00 562

原创 【搭建框架必备基础】Unsloth实战教程

在搭建微调框架的时候发现缺乏了很多必备的搭建框架,如dataclasses、DeepSpeed、unsloth、transformer、fp16库等等框架,一篇文章不足以放下所有内容,因此分开来讲解,以便更好地理解如何搭建微调框架。

2025-05-06 09:59:30 906

原创 机器人操控新突破:ManipLLM如何让机器人像人类一样“思考”并灵活操作物体

最近机器人领域又有新突破啦!今天咱们就来聊聊这篇很厉害的 CVPR 2024 论文 ——ManipLLM这篇工作。这篇论文的研究团队来自北京大学、北京邮电大学和香港中文大学,他们做的研究简单来说,就是让机器人在操控物体的时候变得更聪明、更灵活。下面我就给大家详细唠唠。

2025-05-05 10:00:00 1032

原创 批量归一化(Batch Normalization)与层归一化(Layer Normalization)深度解析

优点大幅加速收敛,允许使用更高的初始学习率。有一定正则化作用,降低对初始权重的敏感性,减少过拟合。在主流图像任务和大型批量训练的场景下表现卓越。缺点依赖足够大的批量尺寸,否则会导致估计方差不稳定。在序列模型(如RNN、Transformer等)或者小批量场景中表现不佳。在分布式训练时,计算全局均值与方差可能比较麻烦,需要额外同步开销。

2025-05-04 10:00:00 927

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除