头发够用的程序员-CSDN博客

原创从零上手地平线 OE 工具链：YOLOv3 的 PTQ 量化与精度验证

本文通过地平线OE工具链在PC端的量化与精度实验，完成了模型上板子前的所有准备工作，从模型量化到算子适配性检查，再到编译生成在地平线计算平台上加载运行的模型，最后通过手写脚本，生成评估所需的数据集，并顺利完成评估工作，经评估，模型精度也符合部署要求。

2026-05-20 23:31:55 464 2

原创从零上手地平线 OE 工具链：ResNet50 的 PTQ 量化与精度验证

本文详细介绍了在本地PC端使用地平线OE工具链部署ResNet50图像分类模型的全流程。通过WSL2+Ubuntu+Docker搭建开发环境，完成模型初始化、预检、数据预处理、量化编译等关键步骤，最终生成可在J6芯片运行的.hbm模型文件。实测结果显示量化后模型精度保持良好，推理结果准确。整个过程无需云端依赖，为车载智驾AI模型的本地化部署提供了可复现的实践方案。

2026-05-17 12:11:05 517

原创 WSL2 Ubuntu 24.04 离线安装 Docker 全流程

本文介绍在WSL2环境下通过离线安装方式解决Docker安装过程中的网络问题。提供了具体步骤，并对安装后的环境进行了简单验证。

2026-05-14 23:34:24 1163

原创 C++和Python面试经典算法汇总（一）

文章主要分享了C++和python面试中常见的算法题目与实现方法。首先介绍了变量交换的三种方式：值传递、指针传递和引用传递，并通过模板实现了通用类型交换函数。随后讲解了字符串复制操作的注意事项。第二部分重点讲解排序算法，包括冒泡排序的实现和快速排序的分治思想。

2026-05-04 16:53:09 376

原创从滑动窗口到矩阵运算：img2col算法基本原理

摘要： img2col通过将局部感受野展开为矩阵形式，将卷积运算转换为高效的矩阵乘法（GEMM），显著提升计算并行度，适配CPU/GPU的矩阵运算架构。

2026-04-25 17:43:26 367

原创【Jetson + TensorRT 部署实战】YOLOv8 C++ 单图端到端推理

本篇博客完整实现了 YOLOv8 在 Jetson 平台上的 C++ + TensorRT 端到端单图检测流程，从模型转换（pt→onnx→engine）、工程搭建、核心推理代码编写，到后处理与可视化，全程可复现、可落地。

2026-03-29 17:17:51 683

原创 GPU 流水线底层探索：从 SIMT 前端到 SIMD 后端的全链路解析

深入解析GPU指令流水线的工作原理及其在AI计算中的关键作用。GPU流水线包含SIMT前端和SIMD后端，分为取指、译码、发射、执行、写回五个阶段。SIMT前端支持线程级编程，SIMD后端实现数据并行处理。还详细探讨了流水线各阶段的工作机制，以及数据冒险、结构冒险和控制冒险的发生原因等。

2026-03-15 23:53:18 594

原创 Python 魔法方法 vs C++ 运算符重载全方位深度对比

本文将深度介绍Python常见的魔法方法，并将部分魔法方法与C++运算符重载进行对比，探讨其在语法结构和实现方式上的差异。

2026-02-15 23:06:15 632

原创万字长文：Python 容器特性、用法及与 C/C++ 的核心对比

Python作为近几年迅速崛起的计算机语言，对各个领域的软件开发都产生了深远影响，能有如此蓬勃的生态与发展势头，容器是必不可少的一环，本文将从各个容器的特性用法等方面入手，深度解析Python的独特魅力。

2026-02-07 12:47:01 910

原创 Ultralytics 实战：YOLOv8n 边缘部署全维度评估

本文基于YOLOv8模型和COCO128数据集，对比评估了PyTorch、ONNX和TensorRT三种模型格式在计算机视觉任务中的部署性能。实验从精度、速度和资源占用三个维度建立评估指标体系，包括mAP、FPS、显存占用等关键指标。

2026-01-18 17:58:26 767

原创 Ultralytics 代码库深度解读【六】：数据加载机制深度解析

详细讲解了Ultralytics数据加载系统的分层架构设计，包括数据源层、数据集层、数据加载层和数据处理层。重点解读了核心组件关系，特别是Dataset与DataLoader的协作机制，以及动态方法getattr的统一调度功能。还以YOLO V8训练为例，展示了从命令行参数解析到实际训练启动的全流程，同时对相关各个函数都进行了深度剖析。

2026-01-04 08:46:05 943

原创 Ultralytics 代码库深度解读【五】：数据预处理与增强Pipeline

对Ultralytics代码库中数据增强Pipeline的搭建方法进行了简单介绍，同时对数据预处理与增强的实现步骤与实现方法进行了深入讲解。

2025-12-23 09:11:23 1230

摘要：探讨了嵌入式开发中浮点运算的性能与精度问题。首先分析了浮点数的存储原理，对比定点数的局限性，指出浮点数通过科学计数法实现数值范围的扩展。重点解读了IEEE 754标准对浮点数存储格式的统一规范，包括单精度、双精度等不同格式的应用场景。随后详细剖析了浮点运算单元(FPU)的硬件设计，以加法器和乘法器为例，说明其运算流程和优化思路，包括单路径/双路径加法器的设计差异。文章揭示了FPU如何通过专用硬件加速浮点运算，为嵌入式开发者理解浮点运算的底层机制提供了技术参考。

2025-11-30 22:55:44 947

原创上位机开发避坑：CANoe CAPL 脚本无法发送 LIN 数据帧的解决方案

解决了CANoe上位机开发中，无法通过脚本发送数据帧的问题。

2025-11-27 09:28:17 264

原创 Ultralytics 代码库深度解读【四】：YOLO V8/V11 网络配置文件解析与完整模型构建流程

本文深入解析了YOLO V8/V11模型的构建流程，重点探讨了YAML配置文件如何驱动神经网络搭建。

2025-11-08 13:20:50 1495

原创 Ultralytics 代码库深度解读【三】：YOLO V8/V11 核心模块可视化拆解（网络结构与参数解析）

详细介绍了YOLOv8和YOLOv11的网络结构1. yaml配置文件中关键参数的含义2. YOLO V8和YOLO V11整体网络的基本构成3. 关键模块的搭建过程

2025-10-29 23:13:06 1408

原创 Ultralytics代码库深度解读【二】： TensorRT 引擎文件的构建与序列化

engine文件是英伟达（NVIDIA）TensorRT 框架生成的模型部署文件，它通常需要以onnx模型作为输入，专门用于在英伟达硬件（如 GPU、 Jetson 系列嵌入式设备等）上进行高性能推理部署。本文将以Ultralytics代码库为例，详细讲述其engine文件的导出过程。

2025-10-12 23:11:18 987

原创 Ultralytics代码库深度解读【一】：onnx模型导出

本文详细剖析了YOLOV8模型导出ONNX格式的代码执行流程。主要包含命令参数解析和模型导出等内容。

2025-10-05 11:50:07 1526

原创 ultralytics工程问题：运行错位

ultralytics开发中遇到的问题，实际执行的项目文件与目标文件不一致。

2025-09-21 10:44:07 296

原创 Pycharm远程同步Jetson Orin Super

pycharm与远程jetson设备的文件同步问题解决方法。

2025-09-20 23:23:24 388

原创万字长文：英伟达 GPU 硬件架构发展史全景回顾

英伟达（NVIDIA）的GPU早已超越了图形渲染的范畴，成为驱动人工智能、科学计算、数据中心和高性能计算的“引擎”。其GPU硬件架构的持续创新是这场变革的核心驱动力。今天，就让我们把时钟拨回20多年前，重温英伟达GPU发展的光辉历程！

2025-09-13 18:03:10 3285

原创 Pycharm远程连接Jetson Orin Super

介绍了pycharm远程连接英伟达jetson orin Super开发平台的详细步骤。

2025-09-07 15:50:55 785 1

原创 Jetson Orin Super YOLO 虚拟环境配置

jetson orin super开发套件YOLO虚拟环境搭建的基本方法与相关问题解决思路。

2025-09-02 09:00:55 1150

原创小米玄戒O1架构深度解析（二）：多核任务调度策略详解

本文从完全公平调度入手，再到能效感知调度器，深入剖析了小米玄戒O1可能采用的多核任务调度策略。

2025-06-11 23:50:04 2110 3

原创小米玄戒O1架构深度解析（一）：十核异构设计与缓存层次详解

这两天，小米的全新SOC玄戒O1横空出世，引发了科技数码圈的一次小地震，那么小米的这颗所谓的自研SOC，内部究竟有着什么不为人知的秘密呢？我们一起一探究竟。

2025-05-26 21:21:43 7569 14

原创《考研失利却成就硬核人生：宇树科技创始人的“技术笃信”哲学》

王兴兴的成功，有哪些可以学习和复制？

2025-05-04 22:41:06 1119

原创 MSPM0GXX单片机内部比较器深度解析

本文仅以TI公司生产的MSPM0GXX单片机为例，对其内部比较器的作用，使用场景，原理进行分析和讲解。

2024-07-21 18:23:56 2756 1

原创 windows电脑网络重置后wifi列表消失怎么办？

恢复wifi图标显示。

2024-07-05 22:16:45 7899 1

原创深入理解内联函数（C语言）

内联函数究竟隐藏着什么样的奥秘，是否总能提升程序的运行效率？

2024-05-25 17:18:05 3311 2

原创锁相环原理解析

锁相环是如何“锁住”相位的，又是如何倍频的？

2024-05-05 18:30:55 4462

原创 CPU流水线技术全面解读

流水线的本质就是拿空间换时间。将每条指令的步骤分解到不同的电路单元，从而使得多个指令并行执行。

2024-02-29 07:23:22 7928 2

原创基于QT的简易计算器（一）

一个基于QT框架的简易计算器，非常好玩。。。

2023-11-02 23:09:00 951 2

原创《C和指针》读书笔记（第十四章预处理器）

编译一个C程序涉及到很多步骤，其中第一个步骤就是预处理阶段(preprocessing)阶段。C预处理器在源代码编译之前对其进行一些文本性质的操作。它的主要任务包括删除注释、插入被#including指令包含的文件的内容、定义和替换由#define指令定义的符号以及确定代码的部分内容是否应该根据一些条件编译指令进行编译。

2023-09-29 09:25:37 524