自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 研究方向知名实验室

持续更新。。。

2024-01-16 16:03:38 1041

原创 改进YOLO:YOLOv5结合swin transformer

在if __name__ == '__main__':中更改cfg。在parse_model(d, ch)函数中增加C3STR。

2023-11-26 18:46:43 644

原创 yoloV5加入SPD-Conv的方法

后续继续尝试其它可以提升小目标检测模型的模块。MAP提升约一个点左右。

2023-11-19 18:59:49 468

原创 给实验室师弟的第一次分享-深度学习基础如何学习

总的来说就是因为深度学习不像学视觉SLAM一样,有行业内公认的《SLAM十四讲》,大家都有方向,但是深度学习的学习资料很杂很散,很可能出现学了2个月,发现自己走错了路,学的没用的问题。

2023-11-10 18:01:14 225 1

原创 YOLO剪枝模型部署到边缘终端设备jeston-orin-nano方法

在网络层实现过程中通常会需要一些临时的工作空间,这个属性会限制最大能申请的工作空间的容量,如果容量不够的话会导致该网络层不能成功实现而导致错误。对象中,我们可以将其保存到磁盘中,下次使用时直接加载这个经过优化的模型即可,这样就可以省去漫长的等待模型优化的过程。对图像做目标检测,在将图像输入给模型之前还需要做一定的预处理操作,预处理操作应该与模型训练时所做的操作一致。属性后,就可以启动优化引擎对模型进行优化了,这个过程需要一定的时间,在嵌入式平台上可能会比较久一点。对象保存了模型所有的信息,所以前面创建的。

2023-11-10 15:45:12 475 1

原创 审稿意见汇总

1.论文写作角度动机不明确:选择YOLOV5的原因(在论文里说明需要)和其它检测压缩算法比的优缺点应用场景受限(为什么只考虑水下)3.参考文献角度:除了参考文献[22]之外,YOLO还有很多轻量级算法。然而,本手稿中没有讨论其他研究。重新提交之前应进行更多的文献调查。4.实验验证和分析不扎实,需要做更多的分析来支持结论。5.应该进一步讨论当前工作的局限性,特别是其相关应用可能面临的挑战。为了让读者更好地理解未来的工作,请给出具体的研究方向。

2023-07-01 18:48:51 1249

原创 旋转目标框angle损失计算:

1.旋转矩形框表示为高斯分布:2.两个高斯分布Wasserstein distance距离:3.

2023-05-26 19:30:09 236

原创 配置服务器

服务器配置Ubantu 20.04安装英伟达驱动安装远程连接(ssh、VNC)CUDA安装CuDNN安装Anaconda安装Pytorch安装Ubantu 20.04桌面版安装下载镜像(iso)文件:下载网址:https://releases.ubuntu.com/20.04.4/下载制作工具Rufus:下载网址:http://rufus.ie/zh/制作启动盘:将制作好的启动盘插入电脑后,开机,按F11(或F10按主板型号选择)进入引导界

2022-12-22 19:24:03 509 1

原创 Fater RCNN 试着加入注意力机制模型

如图,也就是初始化函数中8个卷积层,forward()函数中再加3次上采样和一次Maxpool.经过fpn的输出其实和body输出一样是字典的形式,只不过多了一个"pool"FPN的八个卷积核,左边四个的输入输出,输入为in_channels_list,输出只有一个为out_channels,后面四个卷积核输入输出都为out_channels。3.将得到的baakbone作为参数传入FasterRCNN作为其中一个形参创建FasterRCNN模型。

2022-11-12 19:10:49 3272 8

原创 换FasterRcnn模型backbone

因为VGG16模型的self.features对应第一张图上的虚线部分,因为到虚线时已经下采样32倍,一一般目标检测时下采样16倍即可(下采样倍数太大不容易提取小目标信息),所以采用VGG16第二张虚线的部分,也就是去掉了maxpooling.3.换backbone为EfficientNet(其实EfficientNet的主干部分MBCONV就是MobileNetv3的block,这篇论文提出的网络主要是研究深度宽度和输入分辨率共同的影响)

2022-11-05 18:38:40 1044

原创 Transformer

Swin是2021年微软研究院发表在ICCV上的一篇文章,并且已经获得的荣誉称号。在Swin Transformer中使用了Windows Multi-Head Self-Attention(W-MSA)的概念,比如在下图的4倍下采样和8倍下采样中,将特征图划分成了多个不相交的区域(Window),并且Multi-Head Self-Attention只在每个窗口(Window)内进行。

2022-10-22 19:18:27 2712

原创 RCNN算法流程

CNN其实就是图像分类网络,只不过是在图像分类中在CNN提取特征展平处理之后,要经过一个全连接层(输出通道数为类别个数)和softmax层,这里把这部分去掉了,从而每个框框留下了4096维的特征向量,总共为【2000,4096】。a、SVM是一个二分类器,这里以VOC数据集为例,有20个类别,所以需要20个SVM分类器【4096,20】,每个分类器会输出是该类别的得分。 b、对于SVM输出矩阵【2000,20】,对于每一列,代表这两千个候选框中属于该类别的分数,对于该列,通过非极大值抑制的方式剔除重叠建议

2022-10-20 09:20:03 858

原创 YOLO系列V4-V5

一.v4贡献。

2022-10-08 19:00:01 774

原创 YOLO课程笔记

认为当前框要预测的为真实框,所以希望该框置信度为1(但是因为有IOU的差别,所以其实希望它的置新度为IOU)如果一个真实框和多个候选框重合,之选IOU最大的作为前景,其他的为背景,希望它们的置信度为0(也就是按照不含物体的置信度误差考虑)。1.训练:对于一个框,会生成两个候选框,候选框中通过与真实值IOU,找最大,对最大的候选框选定(要的框),来作微调(回归x,y,h,w)6.框多了,MAP不一定好,因为你不能保证每个框都是好的框,都是符合原始物体形状的框,但是识别率确实提高了。1.多尺度:术业有专攻。

2022-10-04 19:19:51 706

原创 进程和线程

进程:一个正在执行的程序实例,独占一块地址空间(包括代码区、数据区、堆栈区),进程之间地址相互隔离,互不影响。

2022-09-29 14:38:20 115

原创 李航《统计学习方法》公式推导

公式推导

2022-09-04 19:04:21 348

原创 经典论文阅读《ImageNet Classification with Deep ConvolutionalNeural Networks》

1.训练了一个大型深度卷积神经网络来将ImageNet LSVRC-2010竞赛的120万高分辨率的图像分到1000不同的类别中。在测试数据上,得到了top-1 37.5%, top-5 17.0%的错误率,这个结果比目前的最好结果好很多。2.这个神经网络有6000万参数和650000个神经元,包含5个卷积层(某些卷积层后面带有池化层)和3个全连接层,最后是一个1000维的softmax。3.为了训练的更快,我们使用了非饱和神经元并对卷积操作进行了非常有效的GPU实现。.........

2022-08-28 18:41:54 635

原创 LInux命令

重定义输出ls &> /dev/null #输出信息以覆盖方式丢到黑洞ls &>> /dev/null #输出信息以追加方式丢到黑洞命令>>文件1 2>>文件2Linux变量1)本地变量2)环境变量在bash终端中输入bash会进入子shell,按exit退出子shell,可以按输入pstree查看当前进程树set查看所有变量 env查看环境变量 在变量前加$即可调用变量系统常见环境变量P.

2022-02-15 16:54:58 482

原创 【无标题】Cmake的使用

1.单目录单文件在这里插入代码片CMAKE_MINIMUM_REQUIRED(VERSION 3.10) #声明编译该代码所需的最小Cmake版本PROJECT(demo1) ##要编译的工程的名字ADD_EXECUTABLE(demo1 main.cpp)##demo1为生成可执行文件的名字为demo1.exe main.cpp为要编译的对象,文件依赖2.单目录多文件#AUX_SOURCE_DIRECTORY(dir VAR)#发现一个目录下所有的源代码文件并将列表存储在一个变量中#把当

2022-02-13 21:56:03 332

原创 计算级网络笔记

1.URL

2022-02-06 22:55:47 1758

原创 Matlab的简单使用

函数文件的定义和调用●函数文件的定义function 输出形参表=函数名(输入形参表)注释说明部分函数体语句如:function[s,p]=fcircle(r)s=pi*r*r;p=2*pi*r;注:该文件名应与函数名保持一致●函数文件的调用[输出实参表]=函数名[输入实参表]如:[s,p]=fcircle(10)...

2022-01-28 22:51:02 208

原创 C语言编程规范

C语言编程规范1.在一个源文件中,头文件包含、宏定义、结构体联合体定义、函数定义等各有自己的一块区域定义,不要混起来;2.头文件包含:●如果是官方头文件,#include <stdio.h>●如果是用户头文件:#include “bsp_can.h”●原因:< >编译的时候会先从系统目录文件查找," "编译的时候会先从用户目录查找,加快一点编译速度3.结构体联合体定义:●结构体和联合体都需要用typedef重定义;●重定义的名字用全大写+下划线_的方式,和宏定义的

2022-01-26 16:35:10 2097

原创 刚上研究生阅读论文

一、看文献的三个禁忌无选择的精读只看不记师出无名二、如何检索文献国内的文献检索平台:(1)SCI-hub(2)Web of Science(3)学校的数据库国外的文献检索平台:(1)Google Scholar(2)PubMed三、如何筛选文献第一步:读标题第二步:读关键字第三步:读摘要,摘要是一篇文章的总结,一定要认真读,特别是摘要里的结论部分。四、如何阅读文献第一步:读摘要,摘要是一篇文章的精华总结,里面包括了文章的背景,方法,结果,结论。首先读的就是背景和结

2022-01-15 20:24:05 241

原创 文献阅读笔记<<基于深度学习的目标检测算法研究进展>>

1.目标检测:(Object Dection,OD)是一种从视频或者图片中找到感兴趣的区域并标记出来的行为动作, 可以通过算法提取特征来识别定位特定类别的对象。 目标检测主要应用在人脸识别、无人驾驶、指挥以及安防等领域。目标检测功能的核心不在于硬件设备, 而在于算法设计的优劣。不同算法性能的优劣将直接导致目标检测在不同场景下的检测效果。2.自 1998 年美国工程师提出目标检测概念以来, 产生了大量基于手工设计特征的传统算法。这些算 法大多是借鉴穷举的思想,在基于滑动窗口生成的 候选框内提取特征,并将.

2021-10-17 20:59:09 248

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除