- 博客(70)
- 收藏
- 关注
原创 从零上手地平线 OE 工具链:YOLOv3 的 PTQ 量化与精度验证
本文通过地平线OE工具链在PC端的量化与精度实验,完成了模型上板子前的所有准备工作,从模型量化到算子适配性检查,再到编译生成在地平线计算平台上加载运行的模型,最后通过手写脚本,生成评估所需的数据集,并顺利完成评估工作,经评估,模型精度也符合部署要求。
2026-05-20 23:31:55
464
2
原创 从零上手地平线 OE 工具链:ResNet50 的 PTQ 量化与精度验证
本文详细介绍了在本地PC端使用地平线OE工具链部署ResNet50图像分类模型的全流程。通过WSL2+Ubuntu+Docker搭建开发环境,完成模型初始化、预检、数据预处理、量化编译等关键步骤,最终生成可在J6芯片运行的.hbm模型文件。实测结果显示量化后模型精度保持良好,推理结果准确。整个过程无需云端依赖,为车载智驾AI模型的本地化部署提供了可复现的实践方案。
2026-05-17 12:11:05
517
原创 WSL2 Ubuntu 24.04 离线安装 Docker 全流程
本文介绍在WSL2环境下通过离线安装方式解决Docker安装过程中的网络问题。提供了具体步骤,并对安装后的环境进行了简单验证。
2026-05-14 23:34:24
1163
原创 C++和Python面试经典算法汇总(一)
文章主要分享了C++和python面试中常见的算法题目与实现方法。首先介绍了变量交换的三种方式:值传递、指针传递和引用传递,并通过模板实现了通用类型交换函数。随后讲解了字符串复制操作的注意事项。第二部分重点讲解排序算法,包括冒泡排序的实现和快速排序的分治思想。
2026-05-04 16:53:09
376
原创 从滑动窗口到矩阵运算:img2col算法基本原理
摘要: img2col通过将局部感受野展开为矩阵形式,将卷积运算转换为高效的矩阵乘法(GEMM),显著提升计算并行度,适配CPU/GPU的矩阵运算架构。
2026-04-25 17:43:26
367
原创 【Jetson + TensorRT 部署实战】YOLOv8 C++ 单图端到端推理
本篇博客完整实现了 YOLOv8 在 Jetson 平台上的 C++ + TensorRT 端到端单图检测流程,从模型转换(pt→onnx→engine)、工程搭建、核心推理代码编写,到后处理与可视化,全程可复现、可落地。
2026-03-29 17:17:51
683
原创 GPU 流水线底层探索:从 SIMT 前端到 SIMD 后端的全链路解析
深入解析GPU指令流水线的工作原理及其在AI计算中的关键作用。GPU流水线包含SIMT前端和SIMD后端,分为取指、译码、发射、执行、写回五个阶段。SIMT前端支持线程级编程,SIMD后端实现数据并行处理。还详细探讨了流水线各阶段的工作机制,以及数据冒险、结构冒险和控制冒险的发生原因等。
2026-03-15 23:53:18
594
原创 Python 魔法方法 vs C++ 运算符重载全方位深度对比
本文将深度介绍Python常见的魔法方法,并将部分魔法方法与C++运算符重载进行对比,探讨其在语法结构和实现方式上的差异。
2026-02-15 23:06:15
632
原创 万字长文:Python 容器特性、用法及与 C/C++ 的核心对比
Python作为近几年迅速崛起的计算机语言,对各个领域的软件开发都产生了深远影响,能有如此蓬勃的生态与发展势头,容器是必不可少的一环,本文将从各个容器的特性用法等方面入手,深度解析Python的独特魅力。
2026-02-07 12:47:01
910
原创 Ultralytics 实战:YOLOv8n 边缘部署全维度评估
本文基于YOLOv8模型和COCO128数据集,对比评估了PyTorch、ONNX和TensorRT三种模型格式在计算机视觉任务中的部署性能。实验从精度、速度和资源占用三个维度建立评估指标体系,包括mAP、FPS、显存占用等关键指标。
2026-01-18 17:58:26
767
原创 Ultralytics 代码库深度解读【六】:数据加载机制深度解析
详细讲解了Ultralytics数据加载系统的分层架构设计,包括数据源层、数据集层、数据加载层和数据处理层。重点解读了核心组件关系,特别是Dataset与DataLoader的协作机制,以及动态方法getattr的统一调度功能。还以YOLO V8训练为例,展示了从命令行参数解析到实际训练启动的全流程,同时对相关各个函数都进行了深度剖析。
2026-01-04 08:46:05
943
原创 Ultralytics 代码库深度解读【五】:数据预处理与增强Pipeline
对Ultralytics代码库中数据增强Pipeline的搭建方法进行了简单介绍,同时对数据预处理与增强的实现步骤与实现方法进行了深入讲解。
2025-12-23 09:11:23
1230
原创 嵌入式视角下的浮点运算性能之迷
摘要:探讨了嵌入式开发中浮点运算的性能与精度问题。首先分析了浮点数的存储原理,对比定点数的局限性,指出浮点数通过科学计数法实现数值范围的扩展。重点解读了IEEE 754标准对浮点数存储格式的统一规范,包括单精度、双精度等不同格式的应用场景。随后详细剖析了浮点运算单元(FPU)的硬件设计,以加法器和乘法器为例,说明其运算流程和优化思路,包括单路径/双路径加法器的设计差异。文章揭示了FPU如何通过专用硬件加速浮点运算,为嵌入式开发者理解浮点运算的底层机制提供了技术参考。
2025-11-30 22:55:44
947
原创 Ultralytics 代码库深度解读【四】:YOLO V8/V11 网络配置文件解析与完整模型构建流程
本文深入解析了YOLO V8/V11模型的构建流程,重点探讨了YAML配置文件如何驱动神经网络搭建。
2025-11-08 13:20:50
1495
原创 Ultralytics 代码库深度解读【三】:YOLO V8/V11 核心模块可视化拆解(网络结构与参数解析)
详细介绍了YOLOv8和YOLOv11的网络结构1. yaml配置文件中关键参数的含义2. YOLO V8和YOLO V11整体网络的基本构成3. 关键模块的搭建过程
2025-10-29 23:13:06
1408
原创 Ultralytics代码库深度解读【二】: TensorRT 引擎文件的构建与序列化
engine文件是英伟达(NVIDIA)TensorRT 框架生成的模型部署文件,它通常需要以onnx模型作为输入,专门用于在英伟达硬件(如 GPU、 Jetson 系列嵌入式设备等)上进行高性能推理部署。本文将以Ultralytics代码库为例,详细讲述其engine文件的导出过程。
2025-10-12 23:11:18
987
原创 Ultralytics代码库深度解读【一】:onnx模型导出
本文详细剖析了YOLOV8模型导出ONNX格式的代码执行流程。主要包含命令参数解析和模型导出等内容。
2025-10-05 11:50:07
1526
原创 万字长文:英伟达 GPU 硬件架构发展史全景回顾
英伟达(NVIDIA)的GPU早已超越了图形渲染的范畴,成为驱动人工智能、科学计算、数据中心和高性能计算的“引擎”。其GPU硬件架构的持续创新是这场变革的核心驱动力。今天,就让我们把时钟拨回20多年前,重温英伟达GPU发展的光辉历程!
2025-09-13 18:03:10
3285
原创 Pycharm远程连接Jetson Orin Super
介绍了pycharm远程连接英伟达jetson orin Super开发平台的详细步骤。
2025-09-07 15:50:55
785
1
原创 Jetson Orin Super YOLO 虚拟环境配置
jetson orin super开发套件YOLO虚拟环境搭建的基本方法与相关问题解决思路。
2025-09-02 09:00:55
1150
原创 小米玄戒O1架构深度解析(二):多核任务调度策略详解
本文从完全公平调度入手,再到能效感知调度器,深入剖析了小米玄戒O1可能采用的多核任务调度策略。
2025-06-11 23:50:04
2110
3
原创 小米玄戒O1架构深度解析(一):十核异构设计与缓存层次详解
这两天,小米的全新SOC玄戒O1横空出世,引发了科技数码圈的一次小地震,那么小米的这颗所谓的自研SOC,内部究竟有着什么不为人知的秘密呢?我们一起一探究竟。
2025-05-26 21:21:43
7569
14
原创 MSPM0GXX单片机内部比较器深度解析
本文仅以TI公司生产的MSPM0GXX单片机为例,对其内部比较器的作用,使用场景,原理进行分析和讲解。
2024-07-21 18:23:56
2756
1
原创 《C和指针》读书笔记(第十四章 预处理器)
编译一个C程序涉及到很多步骤,其中第一个步骤就是预处理阶段(preprocessing)阶段。C预处理器在源代码编译之前对其进行一些文本性质的操作。它的主要任务包括删除注释、插入被#including指令包含的文件的内容、定义和替换由#define指令定义的符号以及确定代码的部分内容是否应该根据一些条件编译指令进行编译。
2023-09-29 09:25:37
524
原创 《C和指针》读书笔记(第十三章 高级指针话题)
众所周知,指针是C语言的灵魂,所以本书(《C和指针》)才会将较多的笔墨放在指针的相关话题上,本章我们将看到更多关于指针的应用,更好地诠释了C语言的独特魅力。
2023-09-05 23:30:54
531
原创 《C和指针》读书笔记(第十一章 动态内存分配)
在实际开发中(C语言),数组的元素存储于内存中连续的位置上。但是用数组存储数据有个弊端,就是在程序运行之前我们就要知道其大小,在实际开发中,我们并不总能对需要申请的内存做到精准把握,于是乎,新的手段诞生了!
2023-06-15 23:55:41
755
原创 《C和指针》读书笔记(第九章 字符串、字符和字节)
在C语言中,字符串和数组有很多相似之处,且官方提供了很多的库函数可供调用。那么字符串和数组这对姐妹花,究竟有着什么样的亲密关系,而作为我们本期的重点角色,字符串又有何独特之处呢?
2023-06-03 17:41:26
825
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅