自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

转载 无痛涨点:目标检测优化的实用Trick

本文作者分享了自己在图像预处理调参、模型训练调参等方面中的技巧,并提醒读者要多注意数据的分布和呈现的状态。对卷积网络来说,所学习的就是数据集的数据分布,你的卷积核参数最后形成的也是对数据集中特征分布的认知。写这篇文章就是因为up主的邀请,然后分享一下自己工作时候总结的一些经验和技巧,不一定适用别的网络,有的还可能会有反作用,所以也就是给大家提供一个思路,欢迎拍砖吧,因为都是公司数据,分享试验结果也比较麻烦,所以大家看个思路就好。1、预处理技巧分享图像预处理部分调参的主要目的是对输入数据...

2021-06-17 17:20:35 1022

转载 CV算法工程师面试问题总结(语义分割篇) 2021.06.17

一.deeplab系列1.简述Deeplab v1网络DeepLab是结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法。在实验中发现DCNNs做语义分割时精准度不够的问题,根本原因是DCNNs的高级特征的平移不变性(即高层次特征映射,根源在于重复的池化和下采样)。针对信号下采样或池化降低分辨率,DeepLab是采用的atrous(带孔)算法扩展感受野,获取更多的上下文信息。另外,DeepLab 采用完全连接的条件随机场(CRF)提高模型捕获细节的能力。论文模型基于 VGG16

2021-06-17 10:29:13 1856

转载 CV算法工程师面试问题总结(目标检测篇) 2021.06.17

Faster-Rcnn网络1.faster RCNN原理介绍,要详细画出图Faster R-CNN是一种两阶段(two-stage)方法,它提出的RPN网络取代了选择性搜索(Selective search)算法后使检测任务可以由神经网络端到端地完成。在结构上,Faster RCNN将特征抽取(feature extraction),候选区域提取(Region proposal提取),边框回归(bounding box regression),分类(classification)都整合在了一个网络中,

2021-06-17 10:13:42 2764

转载 CV算法工程师面试问题总结(中) 2021.06.16

本篇主要包含了图像滤波、边缘检测相关常考内容等相关面试经验。图像滤波图像滤波:在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制。平滑:也称模糊, 是一项简单且使用频率很高的图像处理方法。平滑的一种作用就是用来减弱噪声。1.列出常见的线性滤波器低通滤波器 允许低频通过高通滤波器 允许高频通过带通滤波器 允许一定范围的频率通过带阻滤波器 允许一定范围的频率通过并阻止其他的频率通过全通滤波器 允许所有频率通过,只改变相位陷波滤波器 阻止一个狭窄频率范围通过2.线性滤波与非...

2021-06-16 22:11:11 1709

转载 CV算法工程师面试问题总结(上) 2021.06.16

优化算法深度学习优化学习方法(一阶、二阶)一阶方法:随机梯度下降(SGD)、动量(Momentum)、牛顿动量法(Nesterov动量)、AdaGrad(自适应梯度)、RMSProp(均方差传播)、Adam、Nadam。二阶方法:牛顿法、拟牛顿法、共轭梯度法(CG)、BFGS、L-BFGS。自适应优化算法有哪些?(Adagrad(累积梯度平方)、RMSProp(累积梯度平方的滑动平均)、Adam(带动量的RMSProp,即同时使用梯度的一、二阶矩))。梯度下降陷入局部最优有什么解决办法? 可以用B

2021-06-16 18:14:22 1240

转载 CV算法工程师面试问题总结(下) 2021.06.16

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-06-16 17:15:33 2867

转载 resnet详解

(参考:深度学习经典网络(4)ResNet深度残差网络结构详解)1.resnet意义随着网络的加深,出现了训练集准确率下降的现象,即“网络退化”。深度残差网络,它允许网络尽可能的加深。2.resnet结构这两种结构分别针对resnet34(左图)和resnet50/101/152(右图),一般称整个结构为一个”building block“。其中右图又称为”bottleneck design”,目的一目了然,就是为了降低参数的数目。看右图,输入是一个3×3×256的特征,第一个步骤用64个1x

2021-06-01 18:18:25 9438 1

转载 focal loss函数详解

(参考:focal loss理解)1.总述Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重,也可理解为一种困难样本挖掘。2.损失函数形式y`是经过激活函数的输出,所以在0-1之间。可见普通的交叉熵对于正样本而言,输出概率越大损失越小。对于负样本而言,输出概率越小则损失越小。此时的损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优。那么Focal loss是怎么改进的呢?首先在原有的基础上加了

2021-06-01 17:04:50 407

转载 roi pooling和roi align的区别

(参考:ROI Pooling和ROI Align)这两个都是用在rpn之后的。具体来说,从feature map上经过RPN得到一系列的proposals,大概2k个,这些bbox大小不等,如何将这些bbox的特征进行统一表示就变成了一个问题。即需要找一个办法从大小不等的框中提取特征使输出结果是等长的。最开始目标检测模型Faster RCNN中用了一个简单粗暴的办法,叫ROI Pooling。该方式在语义分割这种精细程度高的任务中,不够精准,由此发展来了ROI Align。1.roi poolin

2021-06-01 16:08:53 305

转载 ssd(single shot multibox detector)

(参考:SSD网络原理解析)1.ssd网络结构SSD网络是继YOLO之后的one-stage目标检测网络,是为了改善YOLO网络设置的anchor设计的太过于粗糙而提出的,其设计思想主要是多尺度多长宽比的密集锚点设计和特征金字塔。2.vgg16 base layerssd网络以vgg16作为基础的特征提取层base layer,选取其中的conv4_3作为第一个特征层用于目标检测。3.extra feature layer在VGG16 Base Layer的基础上,作者额外的添加了几个特征层

2021-06-01 14:49:59 197

转载 faster rcnn

本文主要讲解以下内容:RPN层ROI PoolingClassification1.Faster RCNN网络结构整体结构详细结构:

2021-06-01 11:52:18 159

转载 yolov5网络结构学习

1. yolov5 网络架构上图是yolov5s的网络结构,它是yolov5系列中深度最小、特征图宽度最小的网络。后面的m、l、x都是在此基础上不断加深、加宽的。网络主要分为输入端、Backbone、Neck、Prediction四个部分。它和yolov3主要不同的地方:(1)输入端:Mosaic数据增强、自适应锚框计算、自适应图片缩放(2)Backbone:Focus结构、CSP结构(3)Neck:FPN+PAN结构(4)Prediction:GIOU_Loss2.输入端(1)Mosa

2021-04-22 10:40:47 56516 19

原创 ubuntu18.04下,驱动安装+cuda10.2+cudnn8.0.4+anaconda3.5.0.1的环境配置

显卡配置:一张2080ti,两张T4系统:Ubuntu18.04(命令:lsb_release -a)驱动:NVIDIA-Linux-x86_64-460.67.runcuda:cuda_10.2.89_440.33.01_linux.runcudnn:cudnn-10.2-linux-x64-v8.0.4.30.tgzconda:Anaconda3-5.0.1-Linux-x86_64.sh1.禁用nouveau打开文件:sudo vim /etc/modprobe.d/black.

2021-04-14 14:56:38 410

原创 win10下Xming+Xshell6远程打开Linux界面

1.下载Xming和Xshell6:1)Xming:链接:https://pan.baidu.com/s/1GWCgerSpMV5Gc_VqhfxAeA提取码:dpwf2)Xshell链接:https://pan.baidu.com/s/1W0yIVlvSDe_YJW3vJTdZwg提取码:ltzu2.配置Xming1)双击Xming安装文件,一路默认,注意Display number的值,可自由设置,后面会用到。2)设置IP充许,如果不设IP充许,将会被Xming拒绝而打不开。a

2021-04-08 10:10:25 1314

原创 vscode远程连接服务器的免密码设置

#1.windows下cmd执行。ssh-keygen -t rsa -b 4096随后会在路径“C:\Users\自己的用户名.ssh”文件夹下产生私钥文件(id_rsa)、公钥文件(id_rsa.pub),记事本打开 id_rsa.pub 并复制全部内容。#2.打开指定文件,粘贴内容,保存退出。/home/用户/.ssh/authorized_keys如果.ssh目录或authorized_keys文件不存在,就自己创建。#3.vscode中打开本地ssh的config文件,指定私钥(i

2021-04-08 09:59:18 900 2

原创 tensorRT量化yolov5模型

tensorRT加速yolov51.下载两个项目git clone https://github.com/wang-xinyu/tensorrtx.gitgit clone https://github.com/ultralytics/yolov5.git2.pt转wts,wts转enginecd yolov5sh weights/download_weights.shcopy tensorrtx/yolov5/gen_wts.py into ultralytics/yolov5cd ul

2021-04-08 09:58:25 1138

原创 tensorRT安装(提前编译opencv)

注:这里仅记录用tar安装tensorRT的流程,注意的是解压版的tar需要我们手动去修改lib的路径,如果是使用安装版的,就不需要了,安装版需要root权限进行安装。1.查询自己的ubuntu、CUDA、cuDNN版本:# 查看cuda版本cat /usr/local/cuda/version.txt# 查看cuDNN版本cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2# 查看ubuntu版本cat /etc/issue

2021-04-08 09:57:24 379

原创 Ubuntu18.04下编译opencv4.5.0+opecv_contrib4.5.0

Ubuntu18.04下编译opencv4.5.0+opecv_contrib4.5.01.下载opencv4.5.0和opencv_contrib4.5.0源码opencv_contrib4.5.0:svn : svn://116.56.140.138/soft/opencv_contrib-4.5.0.zipgithub:https://github.com/opencv/opencv_contrib/archive/4.5.0.zipopencv4.5.0svn:svn:/

2021-04-08 09:55:26 940

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除