BBQ呀-CSDN博客

原创改进YOLO：YOLOv5结合swin transformer

在if __name__ == '__main__':中更改cfg。在parse_model(d, ch)函数中增加C3STR。

2023-11-26 18:46:43 1067

原创 yoloV5加入SPD-Conv的方法

后续继续尝试其它可以提升小目标检测模型的模块。MAP提升约一个点左右。

2023-11-19 18:59:49 809

原创给实验室师弟的第一次分享-深度学习基础如何学习

总的来说就是因为深度学习不像学视觉SLAM一样，有行业内公认的《SLAM十四讲》，大家都有方向，但是深度学习的学习资料很杂很散，很可能出现学了2个月，发现自己走错了路，学的没用的问题。

2023-11-10 18:01:14 444 1

原创 YOLO剪枝模型部署到边缘终端设备jeston-orin-nano方法

在网络层实现过程中通常会需要一些临时的工作空间，这个属性会限制最大能申请的工作空间的容量，如果容量不够的话会导致该网络层不能成功实现而导致错误。对象中，我们可以将其保存到磁盘中，下次使用时直接加载这个经过优化的模型即可，这样就可以省去漫长的等待模型优化的过程。对图像做目标检测，在将图像输入给模型之前还需要做一定的预处理操作，预处理操作应该与模型训练时所做的操作一致。属性后，就可以启动优化引擎对模型进行优化了，这个过程需要一定的时间，在嵌入式平台上可能会比较久一点。对象保存了模型所有的信息，所以前面创建的。

2023-11-10 15:45:12 1061 1

原创审稿意见汇总

1.论文写作角度动机不明确：选择YOLOV5的原因（在论文里说明需要）和其它检测压缩算法比的优缺点应用场景受限（为什么只考虑水下）3.参考文献角度：除了参考文献[22]之外，YOLO还有很多轻量级算法。然而，本手稿中没有讨论其他研究。重新提交之前应进行更多的文献调查。4.实验验证和分析不扎实，需要做更多的分析来支持结论。5.应该进一步讨论当前工作的局限性，特别是其相关应用可能面临的挑战。为了让读者更好地理解未来的工作，请给出具体的研究方向。

2023-07-01 18:48:51 1999

原创旋转目标框angle损失计算：

1.旋转矩形框表示为高斯分布：2.两个高斯分布Wasserstein distance距离：3.

2023-05-26 19:30:09 413

原创配置服务器

服务器配置Ubantu 20.04安装英伟达驱动安装远程连接(ssh、VNC)CUDA安装CuDNN安装Anaconda安装Pytorch安装Ubantu 20.04桌面版安装下载镜像(iso)文件：下载网址：https://releases.ubuntu.com/20.04.4/下载制作工具Rufus：下载网址：http://rufus.ie/zh/制作启动盘：将制作好的启动盘插入电脑后，开机，按F11(或F10按主板型号选择)进入引导界

2022-12-22 19:24:03 656 1

原创 Fater RCNN 试着加入注意力机制模型

如图，也就是初始化函数中8个卷积层，forward()函数中再加3次上采样和一次Maxpool.经过fpn的输出其实和body输出一样是字典的形式，只不过多了一个"pool"FPN的八个卷积核，左边四个的输入输出，输入为in_channels_list，输出只有一个为out_channels，后面四个卷积核输入输出都为out_channels。3.将得到的baakbone作为参数传入FasterRCNN作为其中一个形参创建FasterRCNN模型。

2022-11-12 19:10:49 4020 8

原创换FasterRcnn模型backbone

因为VGG16模型的self.features对应第一张图上的虚线部分，因为到虚线时已经下采样32倍，一一般目标检测时下采样16倍即可（下采样倍数太大不容易提取小目标信息），所以采用VGG16第二张虚线的部分，也就是去掉了maxpooling.3.换backbone为EfficientNet（其实EfficientNet的主干部分MBCONV就是MobileNetv3的block,这篇论文提出的网络主要是研究深度宽度和输入分辨率共同的影响）

2022-11-05 18:38:40 1356

原创 Transformer

Swin是2021年微软研究院发表在ICCV上的一篇文章，并且已经获得的荣誉称号。在Swin Transformer中使用了Windows Multi-Head Self-Attention(W-MSA)的概念，比如在下图的4倍下采样和8倍下采样中，将特征图划分成了多个不相交的区域（Window），并且Multi-Head Self-Attention只在每个窗口（Window）内进行。

2022-10-22 19:18:27 3077 1

原创 RCNN算法流程

CNN其实就是图像分类网络，只不过是在图像分类中在CNN提取特征展平处理之后，要经过一个全连接层（输出通道数为类别个数）和softmax层，这里把这部分去掉了，从而每个框框留下了4096维的特征向量，总共为【2000，4096】。a、SVM是一个二分类器，这里以VOC数据集为例，有20个类别，所以需要20个SVM分类器【4096，20】，每个分类器会输出是该类别的得分。 b、对于SVM输出矩阵【2000，20】，对于每一列，代表这两千个候选框中属于该类别的分数，对于该列，通过非极大值抑制的方式剔除重叠建议

2022-10-20 09:20:03 1002

原创 YOLO系列V4-V5

一.v4贡献。

2022-10-08 19:00:01 875

原创 YOLO课程笔记

认为当前框要预测的为真实框，所以希望该框置信度为1（但是因为有IOU的差别，所以其实希望它的置新度为IOU）如果一个真实框和多个候选框重合，之选IOU最大的作为前景，其他的为背景，希望它们的置信度为0（也就是按照不含物体的置信度误差考虑）。1.训练：对于一个框，会生成两个候选框，候选框中通过与真实值IOU,找最大，对最大的候选框选定（要的框），来作微调（回归x,y,h,w）6.框多了，MAP不一定好，因为你不能保证每个框都是好的框，都是符合原始物体形状的框，但是识别率确实提高了。1.多尺度：术业有专攻。

2022-10-04 19:19:51 827

原创进程和线程

进程：一个正在执行的程序实例，独占一块地址空间（包括代码区、数据区、堆栈区），进程之间地址相互隔离，互不影响。

2022-09-29 14:38:20 180

原创李航《统计学习方法》公式推导

公式推导

2022-09-04 19:04:21 448

原创经典论文阅读《ImageNet Classification with Deep ConvolutionalNeural Networks》

1.训练了一个大型深度卷积神经网络来将ImageNet LSVRC-2010竞赛的120万高分辨率的图像分到1000不同的类别中。在测试数据上，得到了top-1 37.5%, top-5 17.0%的错误率，这个结果比目前的最好结果好很多。2.这个神经网络有6000万参数和650000个神经元，包含5个卷积层（某些卷积层后面带有池化层）和3个全连接层，最后是一个1000维的softmax。3.为了训练的更快，我们使用了非饱和神经元并对卷积操作进行了非常有效的GPU实现。.........

2022-08-28 18:41:54 736

原创 LInux命令

重定义输出ls &> /dev/null #输出信息以覆盖方式丢到黑洞ls &>> /dev/null #输出信息以追加方式丢到黑洞命令>>文件1 2>>文件2Linux变量1）本地变量2）环境变量在bash终端中输入bash会进入子shell,按exit退出子shell,可以按输入pstree查看当前进程树set查看所有变量 env查看环境变量在变量前加$即可调用变量系统常见环境变量P.

2022-02-15 16:54:58 541

原创【无标题】Cmake的使用

1.单目录单文件在这里插入代码片CMAKE_MINIMUM_REQUIRED(VERSION 3.10) #声明编译该代码所需的最小Cmake版本PROJECT(demo1) ##要编译的工程的名字ADD_EXECUTABLE(demo1 main.cpp)##demo1为生成可执行文件的名字为demo1.exe main.cpp为要编译的对象，文件依赖2.单目录多文件#AUX_SOURCE_DIRECTORY(dir VAR)#发现一个目录下所有的源代码文件并将列表存储在一个变量中#把当

2022-02-13 21:56:03 444

原创计算级网络笔记

1.URL

2022-02-06 22:55:47 1841

原创 Matlab的简单使用

函数文件的定义和调用●函数文件的定义function 输出形参表=函数名（输入形参表）注释说明部分函数体语句如：function[s,p]=fcircle(r)s=pi*r*r;p=2*pi*r;注：该文件名应与函数名保持一致●函数文件的调用[输出实参表]=函数名[输入实参表]如：[s,p]=fcircle(10)...

2022-01-28 22:51:02 275

原创 C语言编程规范

C语言编程规范1.在一个源文件中，头文件包含、宏定义、结构体联合体定义、函数定义等各有自己的一块区域定义，不要混起来；2.头文件包含：●如果是官方头文件，#include <stdio.h>●如果是用户头文件：#include “bsp_can.h”●原因：< >编译的时候会先从系统目录文件查找，" "编译的时候会先从用户目录查找，加快一点编译速度3.结构体联合体定义：●结构体和联合体都需要用typedef重定义；●重定义的名字用全大写+下划线_的方式，和宏定义的

2022-01-26 16:35:10 2247

原创刚上研究生阅读论文

一、看文献的三个禁忌无选择的精读只看不记师出无名二、如何检索文献国内的文献检索平台：（1）SCI-hub（2）Web of Science（3）学校的数据库国外的文献检索平台：（1）Google Scholar（2）PubMed三、如何筛选文献第一步：读标题第二步：读关键字第三步：读摘要，摘要是一篇文章的总结，一定要认真读，特别是摘要里的结论部分。四、如何阅读文献第一步：读摘要，摘要是一篇文章的精华总结，里面包括了文章的背景，方法，结果，结论。首先读的就是背景和结

2022-01-15 20:24:05 336

原创文献阅读笔记＜＜基于深度学习的目标检测算法研究进展＞＞

1.目标检测:（Object Dection，OD）是一种从视频或者图片中找到感兴趣的区域并标记出来的行为动作，可以通过算法提取特征来识别定位特定类别的对象。目标检测主要应用在人脸识别、无人驾驶、指挥以及安防等领域。目标检测功能的核心不在于硬件设备，而在于算法设计的优劣。不同算法性能的优劣将直接导致目标检测在不同场景下的检测效果。2.自 1998 年美国工程师提出目标检测概念以来，产生了大量基于手工设计特征的传统算法。这些算法大多是借鉴穷举的思想，在基于滑动窗口生成的候选框内提取特征，并将.

2021-10-17 20:59:09 346

m0_49534117的博客

原创研究方向知名实验室