自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 海思部署:RuyiStudio流程解析(6)-打印结果SvpDetYoloResultPrint

如上,获取nms_thresh阈值、max bboxes number数目、图像width、图像height。利用了上面三个层的索引,得到每个层的size,并得到对应的每个层的像素数目。这些都是在仿真开始之前就需要根据自己算法和图像的实际情况设置好的。将目前的检测结果按照score从大到小排序。对排序后的结果进行非极大值抑制。

2023-09-06 10:41:06 177 1

原创 海思部署:RuyiStudio流程解析(5)-结果解析SvpSampleDetOneSegGetResult

B: 而缩放倍数为 原图的 Width 除以当前 feature map的 Fwidth, 即scale = Width / Fwidth,即 Wsa = Wa /(Width / Fwidth) = Wa * Fwidth / Width.A:上面的Wsa、Hsa分别对应当前feature map下anchor的宽和高,而Wsa 与 Hsa 对通过当前feature map的缩放倍数计算出来的。综合上面的便对一个尺度的输出结果进行了处理操作,而三个尺度,则需要进行三次即可。

2023-09-06 10:05:58 183 1

原创 工程部署-2-神经网络搭建与训练

在开发板上部署一个快速的文字检测模型,并且可以达到实时准确检测的效果:轻量文字检测算法,具体可以通过前面的博客进行细节了解。原始的可以检测多行(几十个文字)、紧凑的文字,而本文的算法处理内容要简单很多,因为需要检测的文字是单行且简短的,如下图所示如上面的这种列车车厢外侧的车厢编号。所以,所需要的,是不必像那样需要用到和进行像素聚合处理流程的。所以网络的输出只需要一个通道的text预测即可,如网络input_size=[1,3,24,120],输出为output=[1,1,24,120]。注意!

2023-08-24 09:07:36 150 1

原创 工程部署-1-飞凌开发板前期准备

目录一、概要二、开发板简介 三、烧写配置1. 开关配置 2. 开机准备3. windows电脑连接开发板 A. 串口连接四、总结与后续操作 原开发资料非常多,故此处只对部署过程中用到的部分进行摘抄记录,以达到对开发板的大致了解。 以OKMX8MPQ-C开发板为例,示意图如下: OKMX8MPQ-C 支持 OTG 和 TF 卡烧写,支持 eMMC 和 QSPI 启动, 如下图所示拨码开关为 EMMC启动: 准备清单:12VDC 电源、 USB A转 Type-C 线一根

2023-08-22 13:37:00 209 1

原创 YOLOR-网络结构与部分解释

所谓的隐性知识向量,就是单独初始化一个向量shape[1,C,1,1], 其中C与前一层的输出outchannels一直,有点类似于通道注意力的意思,然后在训练过程中,参数随着训练一点一点更新。期间读论文真是读的头都大了,因为论文的风格以及绘制的图片与以往所读的有很大的不同,读起来云里雾里,概括最后一句话:YOLOR。,但是论文解释的更加高深,能力有限,不知道理解的是不是到位,这里真心希望大家指正,共同修正。在神经网络中,字面意思中,浅层特征定义为显示知识,深层特征定义为隐式知识;

2023-07-12 14:30:50 221 1

原创 目标追踪算法流程详细介绍

目前常见的目标追踪算法有FairMoT、DeepSort等,本文以。为例掰开了揉碎了进行讲解,力争通过本文一次性了解。

2023-07-06 14:49:31 611 5

原创 YOLOv8-训练流程-损失函数

(1)通过YOLOv8-训练流程-正负样本分配的介绍,我们可以知道,经过预处理与筛选的过程得到最终的训练数据:a. 网络输出值:pred_scores[bx8400xcls_num]、pred_bboxes[bx8400x4]b. 训练标签值:

2023-06-06 10:55:33 11393 18

原创 YOLOv8-训练流程-正负样本分配

本文主要介绍yolov8在训练过程中的两个阶段:1.Task-Aligned Assigner 正负样本动态分配策略2.损失函数计算由于个人感觉官方代码读起来比较困难,故按照自己的思路重新写了一遍,下面将按照自己的代码进行讲解。假设:网络输入大小为:images = b x 3 x 640 x 640类别数目 cls_num = 2 (person + car )超参数 reg_max = 16输出通道为: 4 * reg_max + cls_num则。

2023-05-29 16:14:10 5996 15

原创 YOLOV8-网络结构

1> Head部分不同,YOLOv5是整体上输出的,以80类为例,因为每个像素点为3个anchor,故每个像素点的size为:3*(4 + 1 + 80 )= 255;可以看出,YOLOv8的Head中,不再有之前的Obj 分支,只有解耦的分类和回归分支,并且回归分支使用了Distribution Focal Loss中提到的积分形式表示法。yolov8中提到的anchors与yolov5有本质的区别,在yolov8中只是一个锚点,即预测的中心点或者可以理解为每个像素的中心点,并且。

2023-05-18 13:44:02 6010 5

原创 海思部署:RuyiStudio流程解析(4)-前向传播SvpSampleCnnDetectionForword

前向传播 SvpSampleCnnDetectionForword(SVP_NNIE_ONE_SEG_DET_S *pstDetParam, SVP_NNIE_CFG_S *pstDetCfg)bInstant: 指示是否产生中断的标志。如果输出结果阻塞了下一次操作,请将bInstant设置为HI_TRUE。该部分称为:多点输入输出的CNN网络预测。astSrc[]: 输入数据,类型为array数组。astDst[]:输出数据,为array类型。查询状态过成功并没有信息输出。该部分作用:查询任务是否完成。

2023-05-10 09:31:38 167

原创 海思部署:RuyiStudio流程解析(3)-图像读取SvpSampleReadAllSrcImg

3. stDetParam.stModel.astSeg[0].u16SrcNum:输入的图像数目,读入时会依次读取。1. stDetParam.fpSrc:图像路径列表。

2023-05-10 09:25:41 139

原创 海思部署:RuyiStudio流程解析(2)-网络初始化SvpSampleOneSegDetCnnInit

B: 依次获取图像列表路径(这里的数据指的是txt文件,如image_test_list.txt,可能有多个这样的txt文件,一个就代表一个batch)导入模型,并存放在pstModelBuf中。(SvpSampleNetCom.cpp文件中)C++与Python不同之处就是可以用各种结构体,<4> 检测并获取需要测试的图像列表。函数处理(mpi_nnie.h文件中)函数作用:对上面的获取到的。进行解析,从mmz内存中解析模型。也是一个结构体,再其中的。是一个结构体,而其中的。<6> 其余参数设置。

2023-05-10 09:22:14 242 1

原创 海思部署:RuyiStudio流程解析(1)-RuyiStudio接口调用流程

通过YOLOv3对RuyiStudio的开发部署进行介绍

2023-05-10 09:13:31 329 1

原创 YOSO:实时全景分割网络

对于C2到C5,首先采用1x1的卷积对多级特征图进行通道压缩,然后c3到c5分别进行DCN和upsample操作,从上到下的特征融合,分别得到P5、P4、P3、P2.shape : [b x d x h x w] -> reshape [b,d,hw] , 表示 hw个像素点,每个像素点有d个通道数。为 Per-Attention中得到的映射矩阵 其shape为[b,n,d],如上图,Q分别进行两个全连接得到两个结构Q' 和 Q''。首先通过Conv2d卷积对。

2023-04-12 09:02:45 1253 1

原创 YOLOV6-训练流程

计算损失函数的前提是需要有目标targets,和预测值Preds,而对于预测值Preds的box、cls等的损失计算是需要。

2023-04-07 11:18:46 1363

原创 Swin Transformer之相对位置编码详解

Swin Transformer中非常核心之一即为相对位置编码,在此我将试图将其掰开了揉碎了进行讲解,尽可能以比较形象的方式进行理解。

2022-11-01 14:17:04 6229 15

原创 YOLOV6网络结构

最近美团发布了新的目标检测结构YOLOv6,故本人对照源码对网络框架进行了复现,仅供参考。

2022-08-30 08:59:49 2295

基于行人检测的YOLOv8算法+全套代码+详细解析文档

结合原作者代码和文档,并基于自己的理解重新绘制的可读性更高更易理解的文档,并自己重写的项目代码,注释完整清晰。 代码可读性高,可直接使用

2023-09-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除