Super.Bear-CSDN博客

原创 FFmpeg视频编解码

本文介绍了FFmpeg的核心结构体AVFrame及其相关函数的使用方法。AVFrame是存储未压缩音视频帧数据的关键结构，包含数据指针、行大小、分辨率、像素格式等字段。文章详细解析了AVFrame的内存管理函数（av_frame_alloc/av_frame_free）、数据引用机制（av_frame_ref/av_frame_unref）以及缓冲区分配方法（av_frame_get_buffer）。这些函数共同构成了FFmpeg处理音视频数据的基础框架，支持高效的内存管理和数据操作，为音视频转码、播放等场

2025-09-24 09:39:57 1311

原创 SDL2视频渲染

本文介绍了Qt和SDL2两种图像渲染方法。在Qt中，通过QImage操作像素数据并使用QPainter渲染到窗口；在SDL2中，详细讲解了库的安装配置（包括Linux Qt环境下的常见问题解决）以及基本使用方法，重点介绍了SDL_Init初始化和SDL_CreateWindow创建窗口的API参数及用法。文章提供了完整的代码示例和配置说明，适合开发者快速上手图形渲染开发。

2025-09-24 09:38:00 1207

原创 FFmpeg入门

本文介绍了FFmpeg在Linux系统下的安装配置及Qt开发环境集成方法。主要内容包括： FFmpeg安装：通过源码编译方式安装FFmpeg 4.3版本，配置依赖库路径并验证安装成功； Qt项目配置：在.pro文件中添加FFmpeg头文件路径和库文件链接，通过测试代码验证集成效果； FFmpeg框架组成：简要说明其分层架构，重点介绍AVFormat（封装/解封装）和AVCodec（编解码）两大核心模块的功能特性。

2025-09-14 21:45:10 1308

原创音视频基础

本文介绍了音视频处理的基础知识，主要包括封装格式、编码格式和像素格式三大核心概念。封装格式（容器格式）用于打包视频、音频等数据，常见的有MP4、AVI、FLV等，MP4因其高效压缩和良好兼容性成为主流。编码格式通过压缩技术减少数据量，视频编码如H.264、H.265，音频编码如AAC、MP3，不同编码影响压缩效率和质量。像素格式涉及色彩空间（如YUV）和位深，YUV通过亮度（Y）和色度（UV）分离存储，支持降采样以节省空间。文中还简要对比了RGB与YUV的差异，并说明YUV在广播电视中的应用优势。

2025-09-14 21:43:59 1115

原创计算机体系结构之流水线与指令级并行

本文介绍了流水线技术的定义、分类及性能分析方法。首先阐述了流水线的基本概念，包括机器周期、吞吐量等关键指标，并讨论了实现并行需解决的三个问题。文章将流水线按不同维度划分为均匀/非均匀、标量/向量、单功能/多功能等多种类型，重点分析了静态与动态流水线的区别。通过时空图展示了流水线工作原理，推导了吞吐率、加速比和效率的计算公式，并给出解决瓶颈段的方法。最后以5段RISC处理器为例，说明指令级并行的硬件与软件实现方式，指出流水线虽能减少平均执行时间但不减少总执行时间。全文系统梳理了流水线技术的核心原理与应用特性。

2025-08-30 18:29:34 1453

原创计算机体系结构之单周期MIPS处理器的设计

本文介绍了MIPS指令在单周期处理器中的执行过程，分为五个阶段：取指令（IF）、译码与读寄存器（ID）、运算（EX）、访存与分支（MEM）和写回（WB）。每条指令在单周期内完成，CPI为1，但时钟周期受限于最长执行时间的指令（如lw）。文章详细解析了各阶段的数据通路部件，包括组合逻辑（加法器、ALU等）和存储部件（寄存器堆、存储器等），并阐述了控制单元如何通过ALUOp信号协调ALU完成不同运算。单周期实现虽简单，但时钟周期较长，后续可通过多周期优化提升性能。

2025-08-30 18:13:59 1492

原创计算机体系结构之指令体系结构

指令集系统结构(Instruction Set Architecture ISA)最根本的区别：在于处理器内部数据的存储类型不同。存储类型：堆栈、累加器或一组寄存器。操作数可以显式指定或者隐含指定。（1）堆栈系统结构中操作数隐含地位于栈顶（2）累加器系统结构中的一个隐含操作数就是累加器。（3）通用寄存器结构系统中只能明确地指定操作数，不是寄存器就是存储器地址。不同的指令集系统结构的示意图，箭头指示操作数是输入还是ALU运算的结果，或者既是输入也是结果。灰度较轻表示输入，较重表示结果：

2025-04-13 21:14:59 1495

原创计算机体系结构之量化设计与分析基础

计算机系统结构的原始定义：由程序员所看见到的计算机的属性，即慨念性结构和功能特性，以区分数据流动和控制逻辑设计的组成及物理实现。计算机系统结构（现代定义）：是在满足功能、性能和价格目标的条件下，设计、选择和互连硬件部件构成计算机。其系统结构包括：指令系统设计组成（Organization）:计算机设计方面的高层次CPU内部结构、存储器、I/O系统、多处理器、网络硬件: 计算机的具体实现技术详细逻辑设计、封装、冷却系统、板级设计，功耗等响应时间(Response time)

2025-04-13 21:09:23 981

原创算法分析与设计之常见刷题算法

leetcode刷题中常用的方法！

2025-02-11 18:50:23 790

原创算法分析与设计之近似算法

近似算法（Approximation Algorithm）是一类用于求解优化问题的算法，特别是对于那些难以精确求解的大规模问题。对于许多复杂的 NP-hard 问题，寻找精确解可能是不可行的，因为计算复杂度可能过高，甚至是不可计算的。在这种情况下，近似算法提供了一种有效的替代方案，能够在合理的时间内找到一个“足够好的”解，虽然这个解可能不是最优解。

2025-02-11 18:45:27 1198

原创算法分析与设计之NP问题

NP问题（Nondeterministic Polynomial-time problem）是计算复杂性理论中的一个重要概念，属于计算复杂度类的核心内容。简单来说，NP问题是指那些能够在多项式时间内由非确定性图灵机解决的问题，或者可以在多项式时间内验证其解是否正确的问题。

2025-01-16 20:31:56 1547

原创算法分析与设计之网络流

网络流（Network Flow）是图论中的一个经典问题，广泛应用于计算机网络、运输、资源调度等领域。它主要研究如何在网络中传递流量，使得资源得到有效分配，并且满足特定的约束条件。网络流问题通常涉及到一个带有容量约束的有向图，其中每条边都有一个容量限制，表示在某一单位时间内可以通过的流量。网络流的目标是找到最大可能流量的分配方案，或者在某些特定条件下找到一个最优的流量分配。

2025-01-16 20:22:57 974

原创算法分析与设计之动态规划算法

动态规划（Dynamic Programming，DP）是一种用于解决优化问题的算法技术。它通过将问题分解成更小的子问题，解决这些子问题并将其结果存储起来，避免重复计算，从而提高计算效率。动态规划的核心思想是将原问题分解为子问题，先解决子问题，再用它们的结果来构建原问题的解。

2025-01-15 22:17:15 1321

原创算法分析与设计之贪心算法

贪心算法是一种基于贪心策略的优化算法，通过一系列的选择得到问题的解，，这种启发式的策略并不能总能获得最优解，通常这种算法对于解决一些最优化问题非常有效，尤其是那些可以通过局部最优解来达到全局最优解的问题。对于一个具体的问题，怎么知道是否可用贪心算法解决此问题，以及能否得到问题的最优解呢？这类问题一般具有两个重要的性质：和。是指所求问题的整体最优解可以通过一系列局部最优的选择，即贪心选择来达到。

2025-01-15 21:58:06 1871

原创算法分析与设计之分治算法

分治算法（divide and conquer）的核心思想：分而治之，即将原问题划分成个规模较小，并且结构与原问题相似的独立子问题，递归地解决这些子问题，然后再合并其结果，就得到原问题的解。

2024-12-13 21:13:18 1090

原创算法设计之时间复杂度与渐进分析

算法分析与设计期末复习！

2024-11-27 10:21:43 1483

原创 ncnn之resnet图像分类网络模型部署

以R通道为例，原始图片的像素值是从0到255，所以像素值归一化即像x/255，减去均值再除以标准差就是==（x/255-0.485）/0.299==，把255乘下去也就是==（x-0.485×255）/255×0.299==。打开resnet18.param可以看到resnet18的结构，如上图所示，其中像Convolution，ReLU，Pooling，Split，BinaryOp都是一个算子也就是layer。可以看出输出了三个类别263，264，151，可以对imageneg类别中查找分别对应的标签。

2024-09-01 09:51:41 2058 1

原创 ncnn之yolov5(7.0版本)目标检测pnnx部署

支持python的首选pip，否则就源码编译。ncnn导出路线有以下选择，一般常选用从pt文件或者torchscrip文件导出通过pnnx导出。

2024-08-31 21:25:50 3862

原创 NCNN入门之编译与安装

ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖，跨平台，手机端 cpu 的速度快于目前所有已知的开源框架。基于 ncnn，开发者能够将深度学习算法轻松移植到手机端高效执行，开发出人工智能 APP，将 AI 带到你的指尖。ncnn 目前已在腾讯多款应用中使用，如：QQ，Qzone，微信，天天 P 图等。功能概述支持卷积神经网络，支持多输入和多分支结构，可计算部分分支无任何第三方库依赖，不依赖 BLAS/NNPACK 等计算框架。

2024-08-31 09:10:15 2645

原创自制深度学习推理框架之表达式层的设计与实现

在 PNNX 中，Expression 类**用于表示和处理计算图中的算子或节点的表达式**。这些表达式通常涉及张量之间的运算、函数调用、以及其他数学或逻辑操作。

2024-08-30 19:50:25 1664 1

原创自制深度学习推理框架之卷积和池化算子的设计与实现

池化算子和卷积算子是神经网络中的常见操作，本文将介绍其具体的计算，并了解卷积的加速计算Im2col算法。

2024-08-30 18:18:29 2122

原创自制深度学习推理框架之计算图设计

计算图（Computational Graph）是一种用于表示数学运算和数据流的图结构，在深度学习中，它用于描述神经网络中的操作及其依赖关系。节点：表示操作（如加法、乘法、激活函数等）或变量（如输入、权重、偏置等）。边：表示数据的流动，通常是张量（Tensor）在节点间传递。

2024-08-16 17:33:04 2348

原创自制深度学习推理框架之Tensor模板类的设计与实现

张量（Tensor）是一个多维数组的通用化概念，在数学和计算科学中被广泛使用，特别是在机器学习、物理学和工程学等领域。它是标量（0维张量）、向量（1维张量）和矩阵（2维张量）的一般化，可以扩展到更高的维度。Tensor可以看作是一个具有任意维数的多维数组。张量的维数，即张量的轴的数量。0维张量是标量，1维张量是向量，2维张量是矩阵，依此类推。每个维度的长度。形状决定了张量在每个维度上包含的元素数量。张量中的元素类型，如整型、浮点型等。

2024-08-16 16:52:10 1313

原创自制深度学习推理框架之入门基础

从零自制深度学习推理框架，主要介绍了环境配置和基础库的使用。

2024-08-11 16:46:35 1655

原创 Modern Effective C++前期知识(一)

Modern Effective C++带你体验前所未有的C++学习之旅！

2024-08-11 16:07:15 1300

原创常用 C++ STL 用法

C++ STL常用容器、迭代器和算法。

2024-07-28 15:49:16 1217 1

原创图论之常用算法

介绍图论中常用的相关算法

2024-07-28 11:38:06 2670

原创 C++多线程

在 C++11 之前，多线程编程主要依赖于操作系统提供的 API，如 POSIX 线程（pthread）库。而从 C++11 开始，标准库引入了一组新的线程库，提供了更简洁和跨平台的多线程支持。C++11 标准引入了头文件，使得多线程编程更加简洁和跨平台。新标准库提供了创建和管理线程、同步数据的工具。

2024-07-24 22:24:22 1095

原创 Linux多线程C/C++

在 Linux 中，多线程编程可以显著提高应用程序的性能和响应能力。多线程允许程序在多个线程中并行执行，从而更好地利用多核处理器。Linux 中的多线程编程主要依赖于 POSIX 线程（pthread）库。这个库提供了创建、同步和管理线程的各种函数。使用头文件可以实现多线程应用。

2024-07-24 21:39:25 2067 2

原创深度学习语义分割算法之基础知识

一般在计算机视觉领域分割任务主要分为语义分割(Semantic Segmentation)实例分割(Instance Segmentation)全景分割(Panoramic Segmentation)这三大类。

2024-06-25 19:42:12 2362 5

原创深度学习目标检测算法之RetinaNet算法

目标检测算法RetinaNet网络原理同时介绍了FPN特征金字塔和Focal Loss损失函数！

2024-03-27 21:31:01 15543 2

原创深度学习目标检测算法之SSD算法

SSD目标检测算法原理！！！

2024-03-27 16:21:32 3065

原创深度学习目标检测算法之Faster R-CNN算法

目标检测是当前计算机视觉领域内研究的一个热点，与图像分类不一样的是，目标检测不仅要准确地识别出图像中目标的类别，还要准确的定位该目标的位置，并用边界框把目标框起来。基于深度学习的目标检测算法可以分为两类：二阶算法（Two Stage）和一阶算法（One Stage）二阶算法：先生成区域候选框，再通过卷积神经网络进行分类和回归修正。常见算法有 RCNN、SPPNet、Fast RCNN，Faster RCNN 和 RFCN 等。

2024-03-25 16:57:18 13921

原创 CMake之构建跨平台项目的强大工具

本来在学习TensorRT的时候就想记录一下CMake的知识点的，但是当时由于临近期末各科作业有多一直拖动了现在哈哈哈，最近ROS中也用到了CMake决定整理一下常用的指令。CMake 是一个项目构建工具，并且是跨平台的。

2024-02-06 21:05:12 2145 11

原创 ROS入门之通信机制及常用API

ROS的通信架构是ROS的灵魂，也是整个ROS正常运行的关键所在。ROS通信架构包括各种数据的处理，进程的运行，消息的传递等等。基于发布/订阅的话题通信基于客户端/服务器的服务通信基于RPC的参数服务器，每个通信方式都有自己的特点。这里主要记录了通信架构的基础通信方式和相关概念、各种通信常用API以及其他常用API。在ROS通信协议中，数据载体是通信中的核心组成部分。ROS通过std_msgs库封装了一些原生的数据类型，如等。然而，这些数据类型一般只包含一个data字段，结构相对简单。

2024-02-04 19:57:03 2089

原创基于深度学习的多功能人脸识别系统

这个工程是机器视觉的课程设计作业涉及OpenCV图像处理、DNN网络模型部署、Mqtt阿里云连接以及SMTP邮件发送等几个知识点，以上基于Qt(C++)和OpenCV实现的，趁着寒假简单记录一下开发过程哈哈哈！

2024-02-03 10:44:40 2371 5

原创 ROS1入门之节点与指令

ROS1学习记录！！

2024-02-02 17:03:27 5560

原创 ROS2入门之节点与指令

ROS（Robot Operating System）是一个开源的机器人操作系统框架，最初由Willow Garage公司于2007年发起。ROS提供了一套工具和库，用于构建和开发机器人应用程序。其特点包括基于消息传递的中间件、通信模型、工具集以及开源的性质。ROS的通信机制采用发布-订阅模型和服务调用，使得不同组件（节点）能够实现信息交流。ROS在学术界和工业界都得到广泛应用，但在大规模系统中可能存在通信效率和实时性方面的挑战。ROS 2是ROS的下一代版本，旨在解决ROS的一些限制和缺点。

2024-01-11 20:50:38 4967 2

原创 TensorRT之LeNet5部署(onnx方式)

本文记录一下TensorRT部署流程，上一篇使用wts文件构造网络结构，这篇会使用ONNX构造网络。

2023-12-03 13:50:46 689 2

原创 TensorRT之LeNet5部署(wts方式)

零基础入门学习TensorRT部署深度学习网络，本文记录一下TensorRT部署流程，参考了网上很多例程，可能有的代码是旧版本的，但是这并不影响的，这里主要是使用API的方式构建网络。

2023-11-28 14:41:29 1065

DNN_Face_Recognizer.zip

opencv dnn 人脸识别

2024-04-03

YOLOv5：高效实时目标检测的新巅峰

YOLOv5（You Only Look Once version 5）代表了目标检测领域的最新突破，将高效实时目标检测推向了新的高度。这一算法结合了轻量级网络架构和卓越的性能，为各种应用场景提供了无限可能。我们将深入研究YOLOv5的工作原理、设计创新以及如何在不同场景中应用它。无论您是计算机视觉研究者、工程师，还是对目标检测技术感兴趣的任何人，YOLOv5都将为您的项目带来强大的性能和实时性。不容错过这个有关高效目标检测的精彩探讨！让我们一起来探索这个领域的新巅峰吧。通过OpenCV DNN C++部署yolov5的onnx模型。

2023-09-20

TA关注的人

DNN_Face_Recognizer.zip

YOLOv5：高效实时目标检测的新巅峰

OpenCV YOLOv4：下一代目标检测算法的革命性突破

OpenCV yolov2-tiny 目标检测

OpenCV C++ YOLOv3目标检测

OpenCV Goturn目标追踪

OpenCV 年龄和性别预测

OpenCV FCN图像分割

OpenCV MobileNet-SSD目标检测

OpenCV4-CUDA

OpenCV SSD目标检测(C++)

GoogLeNet图像分类

OpenCV4.5.3编译后的文件包含扩展库文件，可以直接食用

Opencv DNN各种网络模型

赛灵思2020.2安装套件

DOS tool.rar

linux-0.11.zip

linux 0.01内核源代码.zip

qlabel显示视频流问题

神经网络中用到迭代器的作用

Intel (R) HD Graphics 支持神经网络的加速吗

LCD1602显示问题

python 文件排版，怎么控制写入在对应文件的位置(要写吐了，真是服了）

链表空指针问题，temp为什么会出现可能是空指针