自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 Trustworthy Long-Tailed Classification 论文笔记

1.论文介绍TLC的全称为<<Trustworthy Long-Tailed Classification>>,论文最大创新点是在长尾数据分类上引入了信度(Trustworthiness)这个概念,该概念来源于DS证据理论(Dempster-Shafer Evidence Theory),通过计算一个样本的置信度可以降低困难样本被错误预测时的损失。有研究显示用多个分类器可以减少模型的方差,提高长尾数据分类的鲁棒性,因此论文还用到了集成学习,将多个专家(expert...

2022-05-03 09:52:27 1089 6

原创 python dis模块解析

Python代码是编译成字节码(Bytecode)再放到CPython编译器中执行,而dis模块可以将python代码分解为字节码。先上一段代码在输出中,11代表原python代码所在的行数,0代表指令LOAD_CONST的位置索引(在跳转指令中会用到这个索引),LOAD_CONST是人类可读的python字节码指令,它可以以opcode(操作码)100来表示;1表示LOAD_CONST指令的参数,(2)表示该参数对应的值为2。其实可以把1看成是一个字典的key,其对应的value就是2那么第一

2022-03-10 13:00:14 2598

原创 目标检测评估指标 mAP P R

R(召回率recall)=正确预测的正样本数/实际拥有的正样本数P(准确率precision)=正确预测的正样本数/总预测样本数R是查全率,P是查准率,是两个不同维度的衡量方法。有时这两个是矛盾的,比如只检测出了一个结果,且是正确的,那么P就是100%,但是R就会很低。如果我们把所有认为可能的结果都返回,那么P可能就会很低,R就很高比如:R高P低:所有汽车都被正确识别出来,但是很多卡车也被误认为是汽车R低P高:识别出的飞机都是正确的,但还有很多飞机没被识别出来所以衡量一个模型

2022-02-22 16:28:19 4860

原创 pycocotools api的使用

官方的演示:https://github.com/cocodataset/cocoapi各个api之间的关系我的演示(需安装jupyter notebook):链接:https://pan.baidu.com/s/1BQgaWsvjrPmjNuy-vI1NdQ?pwd=qsl6提取码:qsl6

2022-02-22 16:22:30 278

原创 证明: 标准化(批量归一化) 均值为0 方差为1

2022-01-30 12:01:50 6855 4

原创 nn.BatchNorm2d() 手推计算步骤

首先贴上官方文档γ和β初始化时默认为1和0.输入必须是4维的张量x,而对四维张量进行归一化的步骤是: 对不同样本的同一个通道的所有像素进行求均值. 最后得到的均值是一个(1,a,1,1) 的张量, a为通道数量. 即对于每一个通道,都能计算出一个均值. 然后再求方差, 最后进行变换得到输出.首先执行一段代码:然后推导计算过程:计算结果与程序输出一致...

2022-01-30 11:58:34 1483

原创 Resnet介绍

1.简介 作者提出了一种深度学习网络框架resnet,用来解决层数过深时,神经网络训练效果变差的情况。按理来说层数越深,模型的效果就会越好。那些在Imagenet上登顶的网络模型它的网络层数都是非常多的,都不是一两层的网络训练出来的模型。深度是非常重要的,高级语义信息在深层网络时才被提取。而网络越深就越有可能出现梯度爆炸/消失,虽然我们可以通过normalizatio来解决,但网络并不是越深越好。作者给出了下面这张图56层神经网络是20层神经网络比较深的版本(即网络结构一样...

2021-12-03 14:00:29 6550

转载 Anchor box

为什么需要anchor box?在此之前的一些目标识别方法1.滑动窗口 这是比较原始的目标检测方法,给定一个固定尺寸的窗口,根据设定的步伐,一步一步的从左至右、从上至下滑动,把每个窗口输入到卷积神经网络中进行预测和分类,这样做有两个缺点: 1. 由于窗口尺寸固定,因此不适合形变较大的物体 2.窗口较多,运算量大2.区域建议 这是R-CNN系列中核心的思想,以Faster R-CNN为例,模型中使用了两个神经网络,一个是CNN,一个是RPN(Regi...

2021-12-03 13:41:38 139

原创 论文《Multi-Scale Aligned Distillation for Low-Resolution Detection》 对应 github 项目 MSAD安装步骤

一 实验环境ubuntu 18.04 CUDA 10.2 python 3.6 pytorch 1.8.0 torchvision 0.9.0二 安装步骤 1.先创建虚拟环境: conda create -n msad python=3.6 conda activate msad 2.安装pytorch conda install pytorch==1.8.0 torchvision torchaudio cu...

2021-11-30 09:53:38 2737 1

原创 《Multi-Scale Aligned Distillation for Low-Resolution Detection》论文笔记

一、介绍 在实例检测中,用深度学习模型进行推理需要巨大的运算量,这适得模型不容易部署在计算资源有限的嵌入式设备中。加速推理的方法有压缩模型,比如裁剪神经网络的深度或高度、采取高效的分块结构设计。除此之外,降低输入图像的分辨率也可以提高推理速度,但降低输入图像分辨率会导致模型性能退化。因为用低分辨率图片训练的模型比用高分辨率图像训练的模型预测准确度要低。 于是我们希望提升用低分辨率图片训练的模型(以下简称low-res student)的性能,方法是对用高分辨...

2021-11-24 23:25:56 2698

转载 Backbone、Neck 和 Head

目标检测网络的两个重要部分:Backbone和Detection head。一、Backbone通常,为了实现从图像中检测目标的位置和类别,我们会先从图像中提取出些必要的特征信息,比如HOG特征,然后利用这些特征去实现定位和分类。而在在深度学习这一块,backbone部分的网络就是负责从图像中提取特征,当然,这里提出的是什么样的特征,我们是无从得知的,毕竟深度学习的“黑盒子”特性至今还无法真正将其面纱揭开。那么,如何去设计一个backbone去提取图像中的特征呢?从某种意义上来说,如何设计好的

2021-11-21 19:38:25 3620 2

转载 特征金字塔

1.基础cnn架构 传统方法,自底向上卷积,把最后一层变成全连接层来预测label2.图片金字塔 同一张图片的不同分辨率的图片的合集,对不同分辨率图片提取特征。目的:想要提取原始图片的特征,还需要提取其不同分辨率下的图像的特征作为辅助。比如检测人脸的时候,因为我们不知道图像中人脸的尺寸,所以需要生成一个不同大小的图像组成的金字塔,扫描其中每一幅图像来寻找可能的人脸。高斯金字塔:1.缩小图片 矩阵内的元素之和为256,除以256可以归一化,不让像素值溢...

2021-11-21 19:06:10 568

转载 知识蒸馏介绍

知识蒸馏介绍A是效果比较好的大模型,但不适合部署在计算资源有限的小型设备上,可以用知识蒸馏的方法训练一个高效的小模型B。通常只应用于分类任务,且学生只能从头学起知识蒸馏可以分为输出值知识蒸馏和特征值知识蒸馏小模型预测结果为[1,0,0],[0,7,0.29,0.01]是教师模型的,而另外两个图片概率为[0.29,0.01] ,也可能是西红柿和香蕉。这个信息对学生是有意义的,我们希望学生能从图片中提取到其他隐含知识。从老师模型中获得这个信息的过程叫做知识蒸馏。.

2021-11-21 18:49:01 760 1

原创 ubantu 编译 dcraw.c 文件详细步骤

尝试过在windows平台上编译,最终失败告终。遂转战linux平台。详细步骤如下:在ubantu下编译dcraw.c :gcc dcraw.c报错找不到jasper.h文件,应该是没有安装 libjasper-dev,分别执行sudo add-apt-repository "debhttp://security.ubuntu.com/ubuntuxenial-security main"sudo apt updatesudo apt install libjasper1 li...

2021-10-05 16:06:41 525 1

原创 自制coco数据集步骤

1.安装labelme: pip install labelme -i https://mirrors.aliyun.com/pypi/simple2. 命令行输入: labelme3. 打开图片4.点击create polygons,然后对一个鱼进行描边,标签都输入成fish。group_id表示同一个物体的不同部分,这里不考虑铁栏杆的影响,所以group_id可以不用填。最后点击ok对三条鱼标注完就可以点击save了,每张图片都会生...

2021-09-30 23:59:14 2718

原创 deepsnake 安装及训练步骤

安装环境:操作系统:ubantu 16.04python 版本:3.7pytorch+cuda版本: pytorch1.1+cuda10.0https://download.pytorch.org/whl/cu100/torch-1.1.0-cp37-cp37m-linux_x86_64.whl注:用命令nvcc -V 查看显卡cuda版本,pytorch+cuda版本需要与显卡的cuda版本一致首先创建虚拟环境,分别执行以下命令:conda create -n snake p

2021-09-30 23:37:01 1335 2

原创 用自制数据集训练yolov5步骤

一、环境安装 yolov5下载地址:https://github.com/ultralytics/yolov5。解压后点进去,按Shift+右键在该目录启动powershell窗口,输入命令: pip install -r requirements.txt ,系统会自动安装运行所需要的环境二、对图片进行标注 方法一:对于少量图片可以手动标注。进入https://www.makesense.ai/然后再点击右边就可以选择我们想...

2021-09-30 23:22:02 1583 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除