易水潇潇666-CSDN博客

转载数据迁移中的Variable().cuda()理解

由Variable().cuda()谈起_邹小妹的博客-CSDN博客_.cuda()

2022-07-02 21:15:56 949

一、监督学习分类根据数据集的标注情况，分为：监督学习、弱监督学习、弱半监督学习和半监督学习。监督学习：数据集为带实例级标注的标签，包含坐标和类别信息弱监督学习：数据集仅带有数据类别的标签，不包含坐标信息弱半监督学习：数据集中包含少量实例级标注图像，大量数据分类级标注图像，模型期望通过大规模的弱标注数据提升模型的检测能力。半监督学习：数据集中包含少量实例级标注图像，大量未标注图像，模型期望通过大规模的未标注数据提升模型的检测能力。二、弱监督目标检测（Weakly Supervise

2022-01-09 23:12:57 8173

原创【目标检测】yolov5与yolox对比

yolov5 yolox-DarkNet53 yolox-SPP 输入端 Mosaic 自适应锚框计算自适应图片放缩 Mosaic MixUp (注：epoch=15时这两种数据增强方式关闭，由于这种增强效果更好，ImageNet的预训练无意义) 增加了EMA权值更新 Cosine学习率机制增加了RandomHorizantalFlip,ColorJitter,多尺度数据增...

2021-11-29 22:08:27 20514

原创【目标检测】yoloX算法详解

一、yoloX的改进由于yoloV4和yoloV5存在过度优化的问题，因此yoloX以yoloV3和Darknet 53为基线，采用了Darknet 53骨干网的结构架构和SPP层，改变了一些训练策略：增加了EMA权重更新、consine lr schedule、IoU损失和IoU感知分支，使用BCE Loss训练cls和obj，IoU Loss作为test分支。由于RandomResizedCrop和马赛克增强重叠，因此只采用了RandomHorizontalFlip，ColorJitter、mu

2021-11-26 21:55:27 20130 4

原创【目标检测】yoloV5算法详解

一、与yoloV4相比，yoloV5的改进输入端：在模型训练阶段，使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放基准网络：使用了FOCUS结构和CSP结构Neck网络：在Backbone和最后的Head输出层之间插入FPN_PAN结构Head输出层：训练时的损失函数GIOU_Loss，预测筛选框的DIOU_nns二、yoloV5结构框架CBL：CBL模块是由Conv+BN+Leaky_relu激活函数组成Res unit：借鉴ResNet中的残差结构，用来构建深层网络，CBM是

2021-11-23 23:07:28 22447 2

原创【常见问题笔记】常见的安装包网站

mmcv：https://openmmlab.com/installation

2021-11-23 10:19:35 375

原创【目标检测--tricks】FPN和PAN

一、FPN结构FPN结构图：FPN通过利用常规CNN模型内部从底至上各个层对同一scale图片不同维度的特征表达结构，提出了一种克有效在单一图片视图下生成对其的多维度特征表达的方式。它可以有效地赋能常规CNN模型，从而可以生成出表达能力更强地feature maps以供下一阶段计算机视觉任务（如object detection/semantic segmentation等）来使用。本质上说它是一种加强主干网络CNN特征表达的方法。二、PAN结构PAN即PANet，结构图如下：简答来说，就是在FPN

2021-11-22 22:43:54 11880 6

原创切换到国内源下载命令

命令：pip install 安装包 -i http://pypi.douban.com/simple搜集了一些国内的pip源，如下：阿里云：http://mirrors.aliyun.com/pypi/simple/中国科技大学：https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban)：http://pypi.douban.com/simple/清华大学：https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术

2021-10-26 10:31:14 276

原创 YOLO V3算法思想

一、YOLO模型的发展：YOLO各版本对应的输入输出：版本输入输出YOLO V1448 X 448 X37 X 7 X 30YOLO V2416 X 416 X 313 X 13 X 5 X 25YOLO V3416 X 416 X 313 X 13 X 255、26 X 26 X 255、52 X 52 X 255注：在YOLO V2输出中，1313表示网格数，5表述先验框个数，25表示类别数20（VOC 20类对象）+ 边框坐标4 + 边框置信度1

2021-10-25 20:21:26 349

原创目标检测算法的分类

基于深度学习的目标检测算法可分为：One stage和Two stage两周：1、Two stage:先进行区域生成，该区域称之为region proposal（简称RP，一个有可能包含待检物体的预选框），再通过卷积神经网络进行样本分类。任务流程：特征提取 --> 生成RP --> 分类/定位回归。常见tow stage目标检测算法有：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等。2、One Stage不用RP，直接在网络中提取特征来预测物

2021-10-13 14:05:36 1746

原创制作自己的coco数据集

一、整体文件夹形式data_annotated：将原图以及原图生成的json文件都复制进该文件夹。data_dataset_coco：运行labelme2coco.py后生成的文件夹，运行前需要把该文件夹删了labelme2coco.py：将自己数据集转化成coco数据集的脚本。labels.txt：写分类的种类，有固定格式：__ignore___background_dog # 这里填写分类的种类tv/monitor二、labelme标注数据集在数据图片中将物体的轮廓标注出来这里标

2021-10-11 20:55:23 4811 3

原创【笔记】python中的sys.stdout函数

参考博客：https://blog.csdn.net/he_and/article/details/80675070

2021-09-23 16:19:42 369

原创【笔记】pytorch中COCO包

from pycocotools.coco import COCO# 读取文件，其中ann_file必须为json文件coco = COCO(ann_file)

2021-09-14 19:35:42 283

原创【笔记】python中常见的函数（一）

1、bisect是python中的内置函数import bisect# 这里listA表示数组，x表示插入的值，返回的是x插入listA中# 的索引位置bisect.bisect(listA, x)2、glob是python自带的函数用它可以查找符合特定规则的文件路径名。使用该模块查找文件，只需要用到： “*”, “?”, “[]”这三个匹配符：” * ”匹配0个或多个字符；” ? ”匹配单个字符；” [] ”匹配指定范围内的字符，如：[0-9]匹配数字。3、re是python中引入

2021-09-12 19:40:15 264

原创目标检测--mask R_CNN

与faster R_CNN相比，mask R_CNN是用RoiAlign代替了Roi Pooling，在最后计算loss时增加了FCN（mask）层。

2021-09-12 15:07:29 578

原创【论文】小目标检测综述--总结

原论文链接：http://sjcj.nuaa.edu.cn/sjcjycl/article/html/202103001一、小目标定义1.1、小目标定义：基于相对尺度定义基于绝对尺度定义整体特征：像素占比少，覆盖面积小，包含信息少1.2、小目标面临的挑战可利用特征少定位精度要求高现有数据集中小目标占比少样本不均衡问题小目标聚类问题网络结构原因二、小目标检测研究思路2.1、数据增强常见增强方法：扭曲变形、旋转和缩放、弹性形变、随机裁剪和平移、水平翻转、调整图像曝光和饱和度

2021-09-09 21:47:49 2152

原创【笔记】调用gpu并显示gpu的基本信息

# 如果点用了cuda，则将gpu的相关信息打印出来。 # show = True表示打印， show = False表示不打印 if device.type == "cuda": pmr.get_gpu_prop(show=True)

2021-09-09 17:15:26 446

原创【常见数据集】PASCAL VOC 2012

host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

2021-09-08 20:15:18 357

原创【常见数据集】coco2017数据集

http://images.cocodataset.org/zips/train2017.ziphttp://images.cocodataset.org/annotations/annotations_trainval2017.ziphttp://images.cocodataset.org/zips/val2017.ziphttp://images.cocodataset.org/annotations/stuff_annotations_trainval2017.ziphttp://image

2021-09-08 20:13:38 756

原创【linux】常见命令

# 解压zipunzip -o 文件名# 解压tartar -xvf 文件名# 移动文件到指定文件夹mv 文件夹名指定路径

2021-09-08 19:49:43 160

转载【笔记】ImportError: cannot import name ‘_C’ from ‘maskrcnn_benchmark’

参考博客：https://www.freesion.com/article/7056441573/

2021-09-08 14:23:29 2658

原创目标检测--Faster R_CNN

1、faster R_CNN流程步骤1）将图像输入网络得到相应的特征图2）使用RPN结构生成候选框，将RPN生成的候选框投影到特征图上得到相应的特征矩阵3）将每个矩阵通过ROI pooling层放缩到7x7大小的特征图，接着将特征图展平通过一系列全连接层得到预测结果。2、RPNcls layer预测的是前景和背景的概率，reg layer预测的是中心点的x,y以及w,h。对于特征图上的每个3x3的滑动窗口，计算出滑动窗口中心点对应原始图像上的中心点，计算出k个anchor box（注意和prop

2021-09-05 12:32:15 232

原创目标检测--Fast R_CNN

Fast R_CNNFast R_CNN算法流程可分为3个步骤：1）一张图生成1k~2k个候选框（使用Selective Search方法）2）将图像输入网络得到响应的特征图，将SS算法生成的候选框投影到特征图上获得响应的特征矩阵3）将每个特征矩阵通过ROI pooling层缩放到7x7大小的特征图，接着将特征图展平，通过一系列全连接层得到预测结果。注：ROI（Region of Interset）1、一次性计算整张图像特征R_CNN:依次将候选框区域输入卷积神经网络得到特征Fast R_CN

2021-09-04 17:02:45 287

原创目标检测--R_CNN

R_CNNR_CNN算法流程步骤：1）一张图像生成1K~2K个候选区域（Selective Search方法）2）对每个候选区域，使用深度网络提取特征3）特征送入每一类的SVM分类器，判断是否属于该类4）使用回归器精细修正候选框位置1、候选区域的生成利用Selective Search算法通过图像分割的方法得到一些原始区域，然后使用一些合并策略将这些区域合并，得到一个层次化的区域结构，而这些结构就包含这可能需要的物体。2、对每个候选区域，使用深度网络提取特征将2000候选框缩放到227x2

2021-09-04 15:05:56 187

原创【笔记】torch.cuda.is.available()显示false

print(torch.cuda.is.available())Flase原因：把pytorch版本安装成了cpu版的了解决方法：重新安装cuda版的pytorch

2021-09-02 20:18:31 282

原创【笔记】在配置faster-r-cnn时，报错numpy.core.multiarray failed to import

根本原因：numpy版本低解决方法：1、pip uninstall numpy2、pip install -U numpy

2021-09-02 19:08:42 157

原创关于深度学习实战入门

视频：https://space.bilibili.com/18161609?spm_id_from=333.788.b_765f7570696e666f.1代码：https://github.com/WZMIAOMIAO/deep-learning-for-image-processing

2021-09-02 13:38:52 196

原创【笔记】pytorch预训练权重下载地址

1 Resnet: 2 3 model_urls = { 4 'resnet18': 'https://download.pytorch.org/models/resnet18-5c106cde.pth', 5 'resnet34': 'https://download.pytorch.org/models/resnet34-333f7ec4.pth', 6 'resnet50': 'https://download.pytorch.org/models/resnet5.

2021-08-28 12:07:01 5361

原创【笔记】*args和**kwargs的用法

*args和**kwargs的用法：*args必须在**kwargs的前面*args表示传递一个可变参数的数列表给函数实参，这个参数列表的数目位置，长度甚至可以为03） **kwargs表示传递一个可变的关键字参数的字典给函数参数，参数列表长度可以为0或者为其他值。4） args和kwargs在函数调用中使用就相当于pack(打包)和unpack(解包),类似于元组的打包和解包详见：*args和**kwargs用法...

2021-08-28 10:33:27 388

原创【笔记】不显示绘图的方法

在import matplotlib后，加上matplotlib.use(‘agg’)。但是注意：matplotlib.use(‘agg’)必须放在在plt执行前

2021-08-28 10:20:29 207

原创【pandas】间行读取、在表格后追加

一、间行读取import numpy as npimport pandas as pddatafile = u'原csv'data = pd.read_csv(datafile)# data.shape[0]表示表格的行数，data.shape[1]表示表格的列数for i in range(data.shape[0]): if i % 4 != 0: # labels：一个字符或者数值，加上axis ，表示带label标识的行或者列；如 (labels='A', ax

2021-08-28 10:01:21 400

原创【笔记】python实现随机森林

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.ensemble import RandomForestRegressordatafile = u'csv路径'data = pd.read_csv(datafile)data_fea = data.iloc[:, :] # 取数据中指标所在的列# random_state表示随机数,max_depth表示最大叶子model

2021-08-28 09:38:38 646

原创【笔记】python实现PCA

from sklearn.decomposition import PCAfrom pandas.core.frame import DataFrameimport pandas as pdimport numpy as npl = []# 编码格式选择更加广泛的gb18030with open('csv路径', encoding='gb18030',errors='ignore') as fd: line = fd.readline() while line:

2021-08-28 09:31:03 459

原创【笔记】用服务器下载数据集并解压

下载命令：# wget 网址wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar解压命令：# tar xvf 压缩包名tar xvf VOCtrainval_06-Nov-2007.tar

2021-08-27 19:39:52 1741 1

原创 OSError: [Errno 12] Cannot allocate memory问题解决

内存不够，可以将num_worker值调小

2021-08-26 11:24:30 1713

原创 Linux中，ERROR: TensorBoard could not bind to port 6006, it was already in use问题解决

查看tensorboard训练生成的结果，查看指令：tensorboard --logdir=yourpath/train_dir --port=端口号遇到错误：ERROR: TensorBoard could not bind to port 6006, it was already in use解决方法：终端输入：lsof -i:6006这时候在终端会发现：COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAMEtensorb

2021-08-26 10:36:13 2086

原创 mmdetection之初体验

修改了mmdetection中demo/wencam_demo.py，做个一个检测视频的小实验代码及分析如下：import argparseimport osimport cv2import torchfrom mmdet.apis import inference_detector, init_detector# 获取当前文件的路径file_path = __file__# dirname（file_path）表示获取file_path的父路径dir_path = os.path

2021-08-25 21:02:58 291

原创对图像加雾

随机对图片采取三种加雾算法中的一种，使训练不容易产生过拟合。import cv2, mathimport numpy as npdef AddHaze1(img): img_f = img # img = cv2.imread(img_path,-1) #print(img.shape) 参数-1为按原通道读入， #不写的话默认读入三通道图片，例如（112，112，3） #print(img.shape[0])#读入的时图片的高度height #print(img.shape[1])

2021-08-23 13:26:35 3099 1

原创 numpy.random.uniform产生随机数

1、函数原型： numpy.random.uniform(low,high,size)功能：从一个均匀分布[low,high)中随机采样，注意定义域是左闭右开，即包含low，不包含high.参数介绍:low: 采样下界，float类型，默认值为0；high: 采样上界，float类型，默认值为1；size: 输出样本数目，为int或元组(tuple)类型，例如，size=(m,n,k), 则输出m*n*k个样本，缺省时输出1个值。返回值：ndarray类型，其形状和参数size中描述一致。

2021-08-23 13:25:03 1200

原创 mmdetection的安装

文档链接：链接install核心：保证cuda、pytorch、mmcv和mmdetection的版本互相一致步骤：1、查看cuda版本nvcc -V2、创建新的虚拟环境，准备pytorchconda create -n open-mmlab python=3.7 -yconda activate open-mmlab# 安装对应cuda版本的pytorch# https://pytorch.org/get-started/previous-versions/conda install

2021-08-20 16:44:51 444

faster_rcnn.zip 详解

下载simsun.zip

空空如也