2025-4-1 个人记录早上文献阅读——航位推算（DR）、生成式人工智能（Generative AI）、惯性导航系统（INS）【含组合导航】、目标检测YOLO、自动驾驶路径

本文链接：https://blog.csdn.net/weixin_61235989/article/details/146902378

一、航位推算（DR）

航位推算（Dead Reckoning，简称DR）是导航中常用的一种方法，通过已知位置、速度、航向等信息来推算当前位置。它基于一个假设：如果知道当前的位置、航向和速度，就可以在一定时间后通过计算推算出新的位置。航位推算不依赖外部参照物（如GPS卫星、地面标志等），因此被广泛用于航海、航空等领域，特别是在无法获得外部定位信息的情况下。

航位推算的基本原理：

航位推算的基本原理是通过测量船舶或飞机的运动参数（例如航向、速度）来推算当前位置。假设从某个已知的起始位置开始，利用一系列运动数据，计算经过一定时间后的位置。具体计算方式通常涉及以下几个参数：

起始位置：已知的初始位置（通常是通过其他定位方式确定的）。
航向（Course）：航行方向的角度，通常以真北或磁北为参考。
速度（Speed）：物体运动的速度，通常以海里/小时（knots）表示。
时间（Time）：根据速度和航向，推算时间的流逝。

计算过程：

航位推算的核心计算是基于以下公式：

位移 = 速度 × 时间
新位置 = 起始位置 + 位移（根据航向和速度向量进行计算）

航位推算的优缺点：

优点：

不依赖外部信号：航位推算只依赖于当前的位置、速度和航向等信息，不需要GPS或其他外部定位系统，适用于没有GPS信号的环境，如海上或飞行中。
实时计算：能够实时更新当前位置，适合动态变化的环境。

缺点：

误差积累：航位推算的误差会随着时间的推移而积累，尤其是在长时间航行中，误差可能会变得非常大。比如，航向或速度的微小误差，经过一段时间的推算后，可能会导致大偏差。
依赖准确的初始位置和速度信息：如果初始位置或者速度有误，后续的推算结果也会受到影响，导致定位不准确。

实际应用：

海上导航：在海上航行时，尤其是远离陆地、没有其他定位信号的区域，船只常常依靠航位推算来确定航行路径。
航空导航：在飞机飞行中，航位推算也可以作为一种备选的导航方法，特别是在飞行高度较高，信号不稳定或丧失的情况下。

尽管航位推算有误差积累的风险，但它依然是重要的补充导航方法，尤其是在其他定位信号不可用的情况下。为了提高准确性，通常会结合其他导航技术，如GPS、惯性导航等，来校正航位推算结果。

二、生成式人工智能（Generative AI）

生成式人工智能指的是能够生成新的内容或数据的人工智能模型。ChatGPT 就属于这一类模型，它能够生成与输入相关的文本、回答问题、撰写文章、翻译语言等。类似的技术包括文本生成、图像生成（如 DALL·E）、音乐生成等。
这些模型基于深度学习技术，尤其是使用了大型神经网络（如 GPT 模型），来从海量的数据中学习规律，并通过这些规律生成新的内容。

例子：ChatGPT

基于监督学习和强化学习相结合的模型。

01监督学习（Supervised Learning）：

在训练过程中，ChatGPT 使用了大量的标注数据（例如问答对、文章段落等），通过监督学习的方法来学习如何生成合适的回答。这意味着每个训练样本都包含了一个输入和一个对应的正确输出（即标签），模型通过与正确输出的比较来调整其内部参数，逐渐提高预测准确性。
例如，给定一个问题，“谁是美国的总统？”模型的正确答案是“乔·拜登”，通过训练，模型学习如何根据问题生成正确的回答。

02强化学习（Reinforcement Learning）：

除了监督学习外，ChatGPT 还使用了强化学习的技术，尤其是在与用户的互动过程中。强化学习通过奖励信号来调整模型的行为，使模型能通过不断试错来改进自身的决策。
在这种方法中，ChatGPT 根据对话中的反馈（例如人类标注者评分）来优化其回答质量。这个过程有时被称为 Reinforcement Learning from Human Feedback (RLHF)，即从人类反馈中进行强化学习。

三、惯性导航系统（Inertial Navigation System，INS）

全面解读惯性导航系统与技术，看懂只需这一篇！

**惯性导航系统（Inertial Navigation System，INS）**是一种用于测量和推算物体位置、速度和航向的导航技术，它通过内部的惯性测量单元（IMU）来感知运动状态，进而实现不依赖外部信号的自主导航。惯性导航系统广泛应用于航天、航空、航海、导弹系统、自动驾驶等领域，尤其是在GPS信号不可用或不可靠的环境中。

1. 惯性导航系统的基本原理：

惯性导航系统的基本原理基于物体的加速度和角速度测量。通过测量物体在三维空间内的加速度和旋转速率，系统可以计算出物体的速度、位置以及姿态（即物体的方向）。具体流程通常如下：

加速度计（Accelerometer）：测量物体的加速度，通过积分得到物体的速度。
陀螺仪（Gyroscope）：测量物体的角速度，进而计算物体的姿态（即航向、俯仰、滚转角度）。

在这些传感器的基础上，INS 通过连续的加速度和角速度数据推算物体的位置信息。这种方法不需要外部参照，如GPS等，能够在封闭的系统中实现独立的导航。

2. 惯性导航系统的组成：

惯性导航系统通常由以下几个核心部件组成：

惯性测量单元（IMU）：包含加速度计、陀螺仪，负责收集运动和姿态数据。IMU 是 INS 的核心组件。
导航计算单元：根据从IMU收集的数据，通过积分计算位置、速度和姿态。该计算单元通常采用卡尔曼滤波（Kalman Filter）等算法来优化计算结果，减少误差积累。
电源和接口系统：提供系统所需的电力，并与外部设备进行数据交换。

3. 惯性导航系统的工作过程：

初始化：INS 系统首先需要一个已知的初始位置、速度和姿态，这通常通过其他定位技术（如GPS、视觉定位等）进行获取。
数据采集：在导航过程中，IMU 通过加速度计和陀螺仪实时采集运动数据。
积分计算：加速度数据经过积分得到速度，速度数据进一步积分得到位置。角速度数据则计算物体的姿态。
误差校正：由于惯性测量传感器的精度有限，INS 系统会使用一些误差校正技术（如卡尔曼滤波）来减小误差累积的影响。

4. 惯性导航系统的优缺点：

优点：

不依赖外部信号：INS 的最大优势是完全独立于外部导航信号，因此在GPS信号无法获取的环境中（如地下、海底、空间等）仍能有效工作。
高实时性：惯性导航系统能够实时提供导航信息，响应速度快。
适用性强：适用于航空、航天、航海、导弹系统、自动驾驶等多个领域。

缺点：

误差积累：INS 的主要缺点是误差会随着时间的推移而积累，尤其是在没有外部校准的情况下，精度会逐渐下降。加速度计和陀螺仪的误差会随着长时间的积分计算导致定位精度逐步降低。
成本较高：高精度的惯性测量单元（IMU）通常较为昂贵，尤其是在需要高精度导航的应用中，IMU 的成本可能非常高。
依赖初始条件：INS 需要一个准确的初始位置和姿态，如果初始条件有误，误差将会随着时间累积。

5. 惯性导航技术的应用领域：

航天：卫星、航天器和火箭等在没有GPS信号的环境中使用INS来保持稳定的轨迹和姿态控制。
航空：飞机使用INS进行导航，尤其是在飞行中无法依赖地面导航信号的情况下（如飞行过远离地面的区域或高空飞行）。
航海：潜艇和船只在水下航行时，无法使用GPS定位，因此通常依赖INS来实现精确的航行。
导弹和军事设备：导弹和其他军事设备需要高精度的导航，而INS提供了独立的导航能力。
自动驾驶：自动驾驶汽车中，INS 与其他传感器（如激光雷达、摄像头等）结合，提供精确的定位和路径跟踪能力。
机器人：在室内或其他无法依赖GPS的环境中，机器人使用INS进行定位和导航。

6. 惯性导航系统与其他导航系统的结合：

为了弥补惯性导航系统的缺点，通常会将 INS 与其他导航技术结合使用，例如：

01 与GPS结合：在有GPS信号的环境中，INS可以用来提供高精度的短期导航，而GPS用于长期定位校准，减少误差积累。GPS/INS融合系统 或 GPS辅助INS系统。

对于INS与GPS结合的系统，通常被称为 GPS/INS融合系统（GPS/INS Integrated System），具体有时会根据融合的方式不同，称为 紧耦合融合（Tightly Coupled Integration）【在紧耦合融合中，INS和GPS的数据是高度集成的，即在每个时间步，GPS的位置信息和INS的运动信息会一起被处理、融合。GPS数据（如位置、速度）和INS的惯性测量（如加速度、角速度）被同时使用，在一个统一的算法框架中进行联合估计。】或 松耦合融合（Loosely Coupled Integration）【在松耦合融合中，INS和GPS的数据相对独立地进行处理，INS和GPS分别进行计算，然后在某些关键点或时间间隔合并或校正。也就是说，INS和GPS在融合前不进行实时联合估计。】。

组合惯性导航系统-长天智控（青岛）科技有限公司

与视觉导航结合：通过视觉传感器（如相机）提供的位置信息，结合INS的加速度和角速度数据，可以实现更加精确的导航，特别是在无人驾驶汽车中。

对于INS与视觉导航结合的系统，通常被称为 视觉惯性里程计（Visual-Inertial Odometry，VIO）或 视觉惯性系统（Visual-Inertial System）。这类系统通过结合视觉传感器（如相机）和惯性测量单元（IMU）来进行导航，常用于机器人、无人机和自动驾驶领域。

四、YOLO（You Only Look Once）

YOLO（You Only Look Once）是一种实时物体检测算法，广泛应用于计算机视觉领域，特别是在目标检测任务中。YOLO 通过将物体检测任务视为一个回归问题，能够同时预测图像中的物体类别和位置，且具有较高的计算效率和精度。

YOLO算法的基本原理：

YOLO的核心思想是将整个物体检测过程转化为一个单一的回归问题：给定一张图像，模型一次性预测所有物体的类别、位置和边界框（bounding box）。与传统的物体检测方法（如 R-CNN 系列）不同，YOLO 通过将图像划分为网格，利用一个卷积神经网络（CNN）直接预测每个网格中的物体。

图像划分网格：
- YOLO 将输入图像划分为 S×S 的网格（例如 7×7）。每个网格负责预测包含在该网格中的物体。
预测边界框和类别：
- 每个网格预测一个固定数量的边界框（通常为 2 个），每个边界框包含：边界框的中心坐标（x, y）、宽度（w）和高度（h），以及该框的置信度（confidence）。
- 置信度代表该边界框包含物体的可能性，同时还反映了预测框与真实框之间的重叠程度（即交并比，IoU）。
- 每个网格还预测属于不同类别的概率分布。例如，YOLO 可以用于检测多个物体类别，如人、车、猫等。
输出：
- YOLO 输出一个张量，包含每个网格的边界框信息、物体类别概率和置信度。
- 最终，YOLO 会通过非极大值抑制（NMS）算法来去除重叠的框，并选择最佳预测框。

YOLO的优点：

高效率：YOLO 是一个端到端的物体检测方法，速度非常快，适合实时处理。其主要原因在于，YOLO 通过回归的方式一次性预测所有的物体类别和边界框，而不是逐步生成候选框。
统一架构：YOLO 使用单一的卷积神经网络来进行目标检测，使得训练和推理过程非常简单高效。
全局推理：YOLO 考虑整个图像的信息来做出预测，相比其他方法的局部推理，能够更好地处理物体间的上下文关系。
实时性强：由于 YOLO 的高计算效率，它能在视频流或实时图像处理应用中高效运行。

YOLO的缺点：

精度问题：由于 YOLO 是通过全局的推理进行预测，它可能在小物体和密集物体的检测上表现不如一些候选框方法（如 Faster R-CNN）。尤其是当物体较小或靠得很近时，YOLO 可能无法很精确地定位物体。
位置精度：YOLO 在预测物体位置时的精度相对较低，尤其是在边界框的回归过程中，可能会出现边界框与真实物体之间的偏差。

YOLO的不同版本：

YOLO 有多个版本，随着时间的推移，算法不断优化和改进，推出了不同的版本。

YOLOv1：
- 发布时间：2016年
- YOLOv1 是 YOLO 系列的首个版本，通过简单的卷积神经网络架构和回归模型成功实现了快速的物体检测。它将目标检测问题转化为回归问题，快速而有效，但在小物体检测精度上存在一些问题。
YOLOv2 (Darknet-19)：
- 发布时间：2017年
- YOLOv2 对模型进行了改进，使用了更深的网络（Darknet-19）以增强检测能力，提升了精度和召回率。引入了多尺度训练，提高了模型对不同尺寸物体的适应能力。
YOLOv3：
- 发布时间：2018年
- YOLOv3 进一步改进了 YOLOv2，采用了更复杂的网络结构（Darknet-53），并结合了多尺度预测的策略，改进了对小物体的检测能力。同时，YOLOv3 增强了对多个物体类别的识别能力。
- 引入了新的损失函数和激活函数，使得模型在精度和速度上达到了平衡。
YOLOv4：
- 发布时间：2020年
- YOLOv4 通过引入许多最新的优化技巧（如自适应卷积、数据增强技术等）使得模型在精度和速度上有了进一步提升。YOLOv4 提供了一个更高效且强大的物体检测模型，尤其适用于生产环境中的应用。
YOLOv5：
- 发布时间：2020年
- 虽然 YOLOv5 并非原始 YOLO 系列的官方版本（由 Ultralytics 团队开发），但它在速度和精度上做了大量优化。YOLOv5 进一步提高了模型的灵活性，支持多种输入尺寸和训练方式，并且集成了新的增强技术。
YOLOv6 和 YOLOv7：
- 发布时间：2022年
- YOLOv6 和 YOLOv7 是基于 YOLOv4 和 YOLOv5 的改进版本，进一步优化了精度、速度和轻量化，使得该算法适应了更广泛的应用场景，尤其是在边缘设备上。

YOLO的应用场景：

自动驾驶：YOLO 可用于实时检测交通标志、行人、其他车辆等物体，为自动驾驶系统提供安全保障。
安防监控：YOLO 可以实时监控视频流，检测和跟踪可疑物体，如入侵者、车辆等。
机器人视觉：YOLO 能够帮助机器人识别和定位物体，为自动化任务（如抓取、运输等）提供视觉支持。
无人机：在无人机的视觉导航中，YOLO 用于检测地面物体、障碍物等，帮助无人机避障。
医疗影像：YOLO 可用于医学图像分析，例如检测癌症病变、器官位置等。

YOLO的总结：

YOLO 是一种高效、快速的目标检测算法，能够实时处理视频流中的目标检测任务。尽管 YOLO 在处理小物体和密集物体时存在一些挑战，但它仍然是计算机视觉领域最受欢迎的物体检测方法之一，广泛应用于自动驾驶、安防监控、机器人视觉等多个领域。

基于YOLOv8n + OC-SORT + CRCM算法的百香果产量估算

五、自动驾驶路径规划常用算法

1. **A*算法（A-Star Algorithm）**

概述：A*算法是一种经典的路径搜索算法，用于找到从起点到终点的最短路径。它结合了启发式方法和实际路径代价的计算，能有效地找到最佳路径。
原理：A*算法通过计算起点到目标的路径代价和从当前节点到目标节点的估计代价，逐步向最优路径扩展。每个节点的代价由实际代价（g值）和启发式估计代价（h值）组成，总代价为两者之和 f(n)=g(n)+h(n)f(n) = g(n) + h(n)f(n)=g(n)+h(n)。
优缺点：
- 优点：能够找到最短路径，适用于静态环境。
- 缺点：在复杂的环境中，计算量较大，效率较低。
应用：适用于道路较简单、无动态变化的场景，如城市道路、单一目标路径规划等。
解释：A*算法像是根据地图计算最短路径，同时考虑路线的顺畅度和到目标的距离。
举个例子：假设你在城市里开车，A*算法可以帮你避开交通堵塞、红绿灯等，找到最快的路线。