青椒大仙KI11-CSDN博客

原创线代讲解0

我将以“秩+n-r(A)”为主线带领大家推进，不是按传统的” 行列式-矩阵-------特征值 “路线，而是从空间视角“向量与空间，线性变换与矩阵，秩，灵魂公式n-r(A)，方程组，向量的线性相关性，行列式，特征值与特征向量”去感受线代的魅力。为什么选择线代呢，因为我看过市面上很多的线代的课，他们其实都是以应试的角度去让学生去背诵公式和题型，只有宇哥带过一些几何本质的理解，我本人也认为线性代数是一个很有魅力的学科，所以我想带着各位从本质去感受线性代数的魅力。

2026-05-25 18:40:07 47

原创 1024程序员节

【程序员节：数字世界的奠基者】10月24日是中国程序员节，源自1024这个对程序员意义特殊的数字（1GB=1024MB）。该节日既是对程序员群体的致敬，也呼吁关注其工作压力。庆祝活动包括技术论坛、公益骑行等，橙色成为节日象征。随着AI等技术的发展，程序员节逐渐聚焦前沿科技话题，但始终不变的是对代码构建数字世界这一核心价值的认可。从首位女程序员阿达·洛芙莱斯到现代开发者，程序员持续推动着技术创新。

2025-10-24 15:17:09 531

原创论文笔记＜多十字路口交通灯＞Deep Reinforcement Learning for Traffic Light Control in Intelligent Transportation

2.绿波策略是它文章的核心之一，意思就是同步化相邻路口的信号周期，使主干道车辆连续通过多个路口而无需停顿，字面意思就是主干道车辆，只要是开始行驶，就一路绿灯。“实验表明，具有被动观察能力的DDPG算法在网格状道路网络中能够自主产生高级智能行为，即 “绿灯波”策略出现。：仅需实时采集各方向车辆数（状态输入：[Xn1,Xn2,Xn3,Xn4,Ln]），无需全局交通数据，降低部署成本。：它能够通过共享Critic网络协调多个路口的决策，避免局部最优（第IV.C节）。其优势在于：首先它能够。

2025-06-29 10:07:26 489 1

原创论文笔记＜交通灯＞ DEEPREINFORCEMENTLEARNINGFORADAPTIVETRAFFICSIGNALCONTROL

这篇论文提出了一种创新的深度强化学习模型用于交通灯管理，其多目标奖励机制包含四项关键指标：上游车道队列长度、车辆延误、通行车辆数和剩余队列数。最具创新性的是动态绿灯时间惩罚机制，通过指数衰减因子（P=C^counter）柔性引导信号灯切换：在绿灯超过推荐时长时施加逐步增强的惩罚，既避免硬性限制又能保持优化灵活性。该机制允许智能体在必要时（如大流量场景）承受短期惩罚换取长期收益，实现了交通效率与规则适应性的智能平衡。

2025-06-20 10:15:49 357

原创论文笔记＜交通灯＞＜多智能体＞MetaLight:基于价值的元强化学习用于交通信号控制

摘要：论文提出MetaLight框架，采用元强化学习实现交通信号控制的快速迁移学习。其核心改进包括：(1)在FRAP模型基础上引入均值池化(MeanPooling)消除相位需求偏差；(2)将整轮更新改为时间步更新提升训练效率；(3)创新性双级适应机制，通过个体级适应快速调整具体路口参数，通过全局级适应整合多路口经验更新元参数，使模型在新路口只需少量数据即可快速适应。实验表明该框架优于传统深度强化学习方法，实现了跨路口的高效知识迁移。

2025-06-18 21:14:19 1146 1

原创论文笔记＜交通灯＞ IntelliLight:一种用于智能交通灯控制的强化学习方法

IntelliLight提出了一种创新强化学习方法优化智能交通灯控制，针对三个核心问题：1) 通过PhaseGate机制对不同相位激活独立决策分支，解决传统DQN的相位混淆问题；2) 采用MemoryPalace为每个相位-动作组合建立专属记忆池，均衡采样缓解数据不平衡；3) 基于济南市1.7亿条真实交通数据训练，融合CNN提取的图像特征与传统交通参数。实验表明该方法有效提升动态交通环境下的控制性能，其相位门控和记忆池技术特别适用于需处理多模态状态的任务。

2025-06-17 20:44:41 601 1

原创论文笔记＜交通灯＞＜多智能体＞DERLight双重经验回放灯机制

本文提出DERLight算法改进交通信号控制，针对传统优先级经验回放（PER）的存储和计算效率问题，设计双重经验池机制：普通池存储基础交互数据，优先池筛选高价值样本（奖励≥历史均值且＞中位数）并按10%概率启动训练。创新性地引入动态训练周期调节机制，通过加权函数平衡即时与历史奖励影响。采用压力奖励函数（Pi=Nin-Nout）优化车流分布。实验表明该方法在通行时间、吞吐量和收敛速度上优于主流算法，代码实现展示了DQN网络与动态经验池的协同优化。核心创新在于双重经验池与动态周期的组合设计。

2025-06-15 10:01:57 393 1

原创论文笔记＜交通灯＞＜多智能体＞CoLight管理交通灯

摘要：论文《CoLight:学习网络级合作进行交通信号控制》提出了一种基于强化学习和图注意力网络（GAT）的智能交通信号控制模型。该模型将路口信号控制建模为多智能体马尔可夫博弈，每个路口智能体通过观察局部交通状态（车道车辆数、当前相位），利用GAT动态学习邻居路口的影响权重，实现无固定索引的协作决策。核心创新包括：1）观察嵌入层转换原始数据；2）多头GAT层动态分配邻居重要性；3）参数共享与无索引建模提升扩展性。实验表明，CoLight在合成和真实路网中较传统方法（如FixedTime）平均降低旅行时间6

2025-06-13 13:22:27 1693 7

原创论文笔记＜交通灯＞＜多智能体＞AFormal Model for Multiagent Q-Learning Dynamics on Regular Graphs

论文《多智能体Q学习动态在规则图上的形式化模型》研究多智能体强化学习在局部交互场景（如交通网）中的群体行为演化。创新点包括：1)提出邻居配置概率分布模型，量化有限邻居影响；2)推导群体Q值演化的偏微分方程，预测行为变迁速率；3)引入策略选择函数描述个体学习倾向。通过囚徒困境和鹰鸽博弈验证，模型预测误差<0.05，相比传统方法可提升100倍计算速度，为交通调度等局部交互系统提供高效分析工具。

2025-06-12 13:28:36 456 1

原创 25/6/11 ＜算法笔记＞RL基础算法讲解

本文总结了几种强化学习算法及其适用场景：AC算法采用Actor-Critic框架，适合机器人和游戏控制；A2C引入优势函数降低方差；DDPG处理连续动作空间；HAC通过分层决策解决长时域任务；MADDPG用于多智能体协作；MCTS基于模拟搜索适用于规划问题；PlaNet通过潜在模型提升样本效率；PPO采用截断策略确保稳定性；QMIX实现多智能体集中训练分散执行；SAC引入最大熵原则自动调节探索强度。这些算法在游戏AI、机器人控制、自动驾驶等领域有广泛应用。

2025-06-11 22:04:57 1168

原创 CUDAfy的使用

此文章是对一篇使用文档的翻译总结文档地址。

2025-04-18 17:39:41 1000

原创 ILGPU的核心功能使用详解

ILGPU 是一种用于高性能 GPU 程序的新型 JIT（即时）编译器（也称为 kernels）编写的 .基于 Net 的语言。ILGPU 完全用 C# 编写，没有任何原生依赖项，允许您编写 GPU 真正可移植的程序。

2025-04-16 21:52:12 1000

原创 25/4/10 2025AAMAS经济挑战赛的代码包2

今天主要梳理剩余的TaxAI智能体的代码可以看见这是一个基于的多智能体经济仿真系统，结合强化学习框架研究财政政策与异质性家庭行为的动态博弈。Bewley-Aiyagari 模型是宏观经济学中研究异质性主体行为与不完全市场动态的核心框架，其核心思想是通过引入个体层面的未保险风险（如劳动收入冲击）和借贷约束，分析其对总体经济变量（如储蓄、利率、财富分布）的影响。agent:智能体----家庭决策网络学习消费-储蓄策略，政府网络优化税收政策。

2025-04-10 13:31:52 855 5

原创 25/4/9 算法笔记分析2025AAMAS经济挑战赛的代码包1

观察代码目录，我们可以得到，代码包的大概信息。agent:智能体策略实现docs:技术文档库env:经济模拟环境模块--定义经济环境状态空间/动作空间logs:运行日志TaxAI:核心经济模型模块--可能包含税收政策，经济规则等核心算法实现utils:工具函数库--包含数据转换/经济指标计算等通用工具.gitgnore:版本控制模块LICENSE:法律文件main:主控制系统run.log:运行监控系统。

2025-04-09 23:01:37 799

原创 25/4/9 算法笔记 DBGAN+强化学习+迁移学习实现青光眼图像去模糊1

青光眼的主要特征有：视盘形态与杯盘比CDR：青光眼患者主要表现为视杯扩大，盘沿变窄。视网膜神经纤维RNFL：RNFL的厚度与完整性也是一个特征，青光眼患者可见局部或弥漫性变薄透光性增加。OCT影像可量化RNFL厚度，正常值与年龄相关，青光眼患者常出现RNFL厚度低于年龄匹配标准值（如<5%分位为黄色预警，<1%为红色）OCTA影像可显示盘周微血管密度降低，与RNFL变薄区域相关。

2025-04-09 15:03:59 741 3

原创 25/4/6 算法笔记＜仿真O2DES＞基础知识学习

此文章就来整理一下我学习到的O2DES仿真框架的一些核心知识核心概念：模拟器（Simulator）：模拟器是O2DES框架的核心组件，用来管理模拟时钟，事件调度和执行。可以通过Simulator类创建模拟环境，并在其中调度和执行事件。事件（Event）：和事件是模拟中发生的关键电子或变化。事件可以是任何需要在特定事件点执行的操作，可以通过继承Event类来创建自定义事件，并在事件中定义其执行逻辑。资源（Resource）：资源是模拟中有限的实体，例

2025-04-06 15:26:26 579

原创 25/2/18 ＜算法笔记＞ ByteTrack

ByteTrack（发表在 2021 年）是一种高效且精确的 **多目标跟踪（Multi-Object Tracking, MOT）**算法。它属于目标跟踪领域中基于检测的类别（tracking by detection），核心思想是利用目标检测器的高置信度和低置信度检测结果，通过简单的后处理策略实现高效和准确的目标跟踪。多目标跟踪 (MOT) 的主要目的是对视频或帧序列中的多个对象进行检测和跟踪。

2025-02-18 15:47:31 1148

原创 25/2/17 ＜嵌入式笔记＞桌宠代码解析

这个寒假跟着做了一个开源的桌宠，我们来解析下代码，加深理解。

2025-02-17 22:59:02 1499 1

原创 25/2/16 ＜算法笔记＞ DirectPose

的方法，包括平移和平面旋转。相比于传统的位姿估计方法，DirectPose 试图简化复杂的处理流程，采用端到端的方式直接从图像中输出位姿参数。多阶段处理意味着更多时间成本，而 DirectPose 作为端到端方法，能够显著压缩推理时间。DirectPose 是一种端到端的神经网络方法，旨在直接从输入图像获取目标对象的。，比如检测物体位置、预测物体的三维平移和旋转，所有步骤都是自动化的“端到端”处理。实现端到端的目标检测和位姿估计（即 DirectPose），核心在于。是一种直接从图像中预测物体的。

2025-02-16 22:28:13 1328

原创 25/2/16 ＜算法笔记＞ MiDas原理

在计算机视觉中，深度估计旨在为场景中的每个像素估算与摄像机的距离。

2025-02-16 21:58:58 2810

原创 25/2/9 ＜模拟电子技术基础＞基础知识点总结

下面是我自己根据书本，网上查找，加上gpt生成的模拟电子技术基础的知识点。

2025-02-09 18:51:00 2319

原创 25/2/8 ＜机器人基础＞阻抗控制

阻抗控制旨在通过调节机器人与环境的相互作用，控制其动态行为。阻抗可以理解为一个力和位移之间的关系，涉及力、速度和位置的协同控制。我们可以将机械臂视为一个简单的质量-弹簧-阻尼器系统，其运动方程为：x是位置Fext 是外部施加的力。

2025-02-08 22:57:37 1116

原创 25/2/8 ＜机器人基础＞轨迹控制基本知识点，传动系统

轨迹是机器人在运动过程中位置、速度、加速度随时间的变化。

2025-02-08 11:55:37 1344

原创 25/2/7 ＜机器人基础＞牛顿-欧拉递推公式，开闭环

开环控制：机器人按照预先设定的命令执行任务，但不会对执行过程中的状态进行反馈和调整。其输入不依赖于输出，即系统的输出对控制作用没有任何影响。闭环控制：机器人通过传感器或其他检测设备获取执行任务过程中的状态信息，将这些信息反馈给控制系统，从而实现对机器人执行任务过程中的实时控制和调整。其输出会反馈给输入端从而影响输入。

2025-02-08 10:50:23 1374

原创 25/2/7 ＜机器人基础＞雅可比矩阵计算雅可比伪逆

假设我们有一个简单的两个关节的平面机器人臂，其末端执行器的位置可以表示为：L1 和 L2 是机器人臂的长度。θ1 和 θ2是关节的角度。力雅可比矩阵通常表示为 JfJf，用于将末端执行器的力（或力矩）映射到关节力（或关节力矩）：F 是末端执行器施加的力向量。τ 是关节施加的力向量（常称为关节扭矩）。Jf是力雅可比矩阵。假设末端执行器的状态由位置 (x,y,θ) 表示，其中 (x,y)是末端执行器的位置，θ 是其朝向角。

2025-02-07 11:42:06 2401

原创 25/2/6 ＜机器人基础＞运动学中各连杆的变换矩阵求法

变换矩阵能够将复杂的运动分解为旋转和平移的组合。通过矩阵乘法，可以将多个连续的运动操作合并为一个单一的变换矩阵，从而简化运动学分析。例如，在机器人正运动学中，通过连乘各个关节的变换矩阵，可以得到末端执行器的总变换矩阵。在机器人学中，各连杆的变换矩阵用于描述相邻连杆坐标系之间的位置和姿态关系。总变换矩阵在机器人学、计算机图形学和控制系统中具有重要作用，主要用于描述机器人末端执行器（或任何目标点）相对于基坐标系的位置和姿态。在多机器人系统中，总变换矩阵可以描述不同机器人之间的相对位置和姿态，从而实现协作任务。

2025-02-06 22:44:34 2088

原创先启动slam_toolbox再启动rviz2发现没map数据

我是这样解决的，但是我查了GPT他说是应该先slam_toolbox再rviz2，但是我加载不出。我们只需先运行rviz2,再连接slam_toolbox就ok了。打开rqt发现TF树也会完整。当我们检查了gazebo,rviz2,slam_toolbox的日志发现都没问题的时候。我们在运行slam连接地图的时候发现rviz2里面的map没有。大伙看着解决吧，我只是提供一个建议。就是下面会报黄色感叹号。

2025-01-25 10:49:29 801

原创 ROS2使用gazebo报错site:fishros.org.cn [Err] [RTShaderSystem.cc:480] Unable to find shader lib. Shader ge

面对这个错误我们只需要将的设置添加到你的~/.bashrc文件中。

2025-01-24 18:40:05 600

原创 25/1/22 算法笔记＜ROS2＞ TF变换

是 ROS（Robot Operating System）中的一个核心功能，用于管理和发布坐标系之间的变换关系。TF 的主要作用是描述机器人系统中各个部分（如传感器、执行器、底盘等）之间的位置和姿态关系，从而实现数据的统一和模块化。是 ROS（Robot Operating System）中用于描述两个坐标系之间固定不变的变换关系的一种机制。静态 TF 适用于那些在机器人系统中不会随时间变化的坐标系关系，例如传感器相对于机器人底盘的位置和姿态。以下是使用 C++ 编写的发布静态 TF 变换的完整代码。

2025-01-22 20:30:38 1104

空空如也

viscode,中环境添加模块的问题