自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(73)
  • 收藏
  • 关注

原创 目标检测模型---SSD

目标检测定义

2022-05-11 14:51:24 4582 1

原创 图像特征与描述

图像特征与描述1.颜色特征1.1 量化颜色直方图1.2 聚类颜色直方图问题2.几何特征:边缘问题3.基于特征点的特征描述子1.颜色特征见1.1及2.1颜色特征提取1.1 量化颜色直方图适用于RGB、HSV等颜色空间。操作:颜色空间量化,单位(bin)由单元中心代表,即统计落在量化单元上的像素数量最常用的方法是将颜色空间的各个分量(维度)均匀地进行划分。1.2 聚类颜色直方图适用Lab等颜色空间。操作:使用聚类算法对所有像素点颜色向量进行聚类,单元(bin)由聚类中心代表。聚类算法则考虑到

2022-04-17 19:14:32 2617

原创 图像预处理

图像预处理

2022-04-17 14:36:54 5774

原创 目标检测--评价指标

目标检测--评价指标1. 评价指标1. 评价指标

2022-04-12 15:51:46 2687

原创 图像数据格式

图像数据预处理1. 图片格式1. 图片格式

2022-04-01 16:59:12 5991

原创 图像特征总结(三)

图像特征总结(三)1. LBP特征提取方法总结1. LBP特征提取方法总结Histogram:图像对比度是通过灰度级范围来度量的,而灰度级范围可通过观察灰度直方图得到,灰度级范围越大代表对比度越高;反之,对比度越低,低对比度的图像在视觉上给人的感觉是看起来不够清晰,所以通过算法调整图像的灰度值,从而调整图像的对比度是有必要的。GLCM:灰度共生矩阵用于描述纹理特征。Color:颜色空间转换ShapeContext:形状上下文特征,基于物体轮廓样本点进行描述的,具体来说是基于计算形状相似性以及点与

2022-03-30 10:50:05 582

原创 图像特征总结(二)

图像特征总结(二)1.Histogram(直方图)特征1.1 直方图均衡化1.2 直方图规定化2.3 例子2. GLCM(灰度共生矩阵)2.1GLCM原理参考资料链接1.Histogram(直方图)特征灰度直方图是最简单、有用的工具之一。从对图像的分析与观察,直到形成一个有效的处理方法,都离不开直方图。直方图:表示数字图像中每一灰度级像素出现的频次(该灰度级的像素数目)。p(k)=nkp(k) = n_kp(k)=nk​,nkn_knk​是图像中第k个灰度级的像素总数。或者p(rk)=nknp(r_

2022-03-28 16:23:32 6676

原创 图像特征总结(一)

图像特征总结1.Histogram(直方图)特征1.1 直方图均衡化1.2 直方图规定化1.3 例子2. GLCM参考资料链接1.Histogram(直方图)特征灰度直方图是最简单、有用的工具之一。从对图像的分析与观察,直到形成一个有效的处理方法,都离不开直方图。直方图:表示数字图像中每一灰度级像素出现的频次(该灰度级的像素数目)。p(k)=nkp(k) = n_kp(k)=nk​,nkn_knk​是图像中第k个灰度级的像素总数。或者p(rk)=nknp(r_k) = \frac{n_k}{n}p(

2022-03-27 20:46:23 9958

原创 opencv--视频操作

opencv--视频操作视频读写1 从文件中读取视频并播放2 保存视频视频读写1 从文件中读取视频并播放在OpenCV中我们要获取一个视频,需要创建一个VideoCapture对象,指定你要读取的视频文件:创建读取视频的对象cap = cv.VideoCapture(filepath)参数:filepath: 视频文件路径视频的属性信息获取视频的某些属性,retval = cap.get(propId)参数:propId: 从0到18的数字,每个数字表示视频的属性。常用属

2022-03-24 21:02:14 4695

原创 opencv--图像特征提取与描述

opencv--图像特征提取与描述1.图像的特征2. Harris和Shi-Tomas算法2.1 Harris角点检测2.1.1 原理2.1.2 实现2.2 Shi-Tomasi角点检测2.2.1原理2.2.2 实现3.SIFT/SURF算算法3.1SIFT算法3.1.1 SIFT原理3.1.2 SIFT算法基本流程3.1.3 尺度空间极值检测3.1.4 关键点定位3.1.5 关键点方向确定3.1.6 关键点描述3.2 SURF原理3.3 实现4.Fast和ORB算法4.1 Fast算法4.1.1 Fast

2022-03-24 19:29:39 1534

原创 opencv--模板匹配和霍夫变换

opencv--模板匹配和霍夫变换1 模板匹配1.1 原理1.2 实现2.霍夫变换2.1 原理霍夫线检测2.3 霍夫圆检测1 模板匹配1.1 原理模板匹配是指在给定的图片中查找和模板最相似的区域,该算法的输入包括模板和图片。其整个任务的思路是按照滑窗,不断地移动模板图片,计算其与图像中对应区域的匹配度,最终将匹配度最高的区域选择为最终的结果。实现流程:准备两幅图像:原图像(I):在这幅图中,找到与模板相匹配的区域模板(T):与原图像进行比对的图像块滑动模板图像与原图像进行比对:

2022-03-23 20:39:25 279

原创 opencv--边缘检测

opencv--边缘检测1 边缘检测原理2 Sobel检测算子2.1 Sobel检测方法2.2 应用3 Laplacian算子4. Canny边缘检测4.1 原理4.2应用5 算子比较1 边缘检测原理边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。边缘的表现形式如下所示:优势:图像边缘检测大幅度地减少了数据量,并且剔除了可以认定为不相关地信息,还可以保留图像重要地结构属性。用于边缘检测的方法可以分

2022-03-23 19:50:52 3786

原创 opencv--直方图

opencv--直方图1. 灰度直方图1.1 原理1.2 直方图的计算和绘制1.3 掩膜的作用2 直方图均衡化2.1 原理及应用1. 灰度直方图1.1 原理直方图是对数据进行统计的一种方法,并将统计值组织到一系列事先定义好的bin中。其中,bin为直方图中经常用到的一个概念,即直条或组距,其数值是从数据中计算出的特征统计量。这些数据可以是:梯度、方向、色彩或任何其他特征。图像直方图是用以表示数字图像中亮度分布的直方图,标绘了图像中每个亮度值的像素个数。这种直方图中,横坐标的左侧为较暗的区域,而右侧为

2022-03-23 15:15:59 3220

原创 opencv--图像平滑

opencv--图像平滑1.图像噪声二级目录三级目录1.图像噪声二级目录三级目录

2022-03-22 20:53:23 201

原创 opencv--形态学操作

opencv--形态学操作1 连通性2 形态学操作2.1 腐蚀和膨胀2.1.1 腐蚀2.2 膨胀2.2 开闭运算2.2.1 开运算2.2.2 闭运算2.3 礼帽和黑帽1 连通性图像中,最小的单位为像素,每个像素周围有8个邻接像素,常见的邻接关系有三种:4邻接、D邻接和8邻接。即:4邻接:像素p(x,y)p(x, y)p(x,y)的4邻域是(x+1,y);(x−1,y);(x,y+1);(x,y−1)(x+1, y); (x-1, y); (x, y+1); (x, y-1)(x+1,y);(x−

2022-03-21 21:39:52 954

原创 opencv--图像处理

opencv--图像处理1. 图像的几何变换1.1 图像缩放1.2 图像平移1.3 图像旋转1.4 仿射变换1.5 透射变换1. 图像的几何变换1.1 图像缩放缩放是针对图像进行大小调整,即图像放大或缩小APIcv2.resize(src,dsize,fx=0,fy=0,interpolation=cv2.INTER_LINEAR)参数:src:输入的图像dsize:绝对尺寸,直接指定调整后图像的大小,为一二维元组(cols, rows),注:图像的shape前两维为(rows,cols)

2022-03-21 19:33:24 2074

原创 opencv--算术操作

opencv--算术操作1. 图像的加法2. 图像的混合三级目录1. 图像的加法API接口cv.add(img1, img2)可以将两幅图相加,或者可以简单地通过numpy操作将两个图像相加,即img=img1 + img2。规定:两个图像应该有相同的大小和数据类型,或者第二个图像为标量值。注:opencv加法和numpy加法之间存在差异,opencv为饱和操作(大于一个上限或小于一个下限,那么最后结果为上限或下限),numpy相加为模运算(大于上限值时,结果为对上限值进行取余)# 8位整数型运算

2022-03-21 14:56:07 802

原创 opencv---基本操作

opencv基本操作1. 图像的IO操作1.1 读取图像1.2 显示图像1.3 保存图像2 绘制几何图形2.1 绘制直线三级目录1. 图像的IO操作1.1 读取图像API接口函数为cv.imread(path, int),参数为:要读取的图像文件位置读取方式的标志1 表示cv.IMREAD*COLOR:以彩色模式加载图像,任何图像的透明度都将被忽略。是默认参数。0 表示cv.IMREAD*GRAYSCALE:以灰度模式加载图像-1 表示cv.IMREAD_UNCHANGED:包括a

2022-03-21 11:11:53 1091

原创 opencv---介绍

opencv---介绍1. opencv1.1 图像处理简介1.2 数字图像的表示1.2.1 位数1.2.2 图像分类1. opencvopencv是一种开源的图像处理库,包括基本的图像处理方法:几何变换,形态学变换图像平滑直方图操作模糊匹配霍夫变换以及特征提取和描述方法:理解角点特征Harris和Shi-Tomas算法(角点特征)SIFT/SURF算法(尺度不变)Fast算法(快速提取图像特征点)ORB算法(快速进行特征提取并进行特征描述)1.1 图像处理简介模拟图像,即

2022-03-19 15:59:42 750

原创 SSD代码实现

SSDcoco数据集构建文件VOC数据集构建文件三级目录coco数据集构建文件import osimport torch.utils.dataimport numpy as npfrom PIL import Imagefrom ssd.structures.container import Containerclass COCODataset(torch.utils.data.Dataset): class_names = ('__background__',

2022-03-18 14:32:02 685

原创 Yolov3代码实现

Yolov3voc数据集构建文件VOC数据集dataset构建文件VOC2CSVYolov3配置文件模型backbone构建yolo head预测文件conv层模块代码文件残差模块激活函数模块损失函数模块特征金字塔yoloyolov3网络代码构建voc数据集构建文件import sysimport xml.etree.ElementTree as ETimport config.yolov3_config_voc as cfgimport osfrom tqdm import tqdmsys.

2021-12-24 19:52:54 2895 1

原创 SeNet代码实现

SeNet开发环境准备工作项目代码结构cifar10转png程序数据集构建文件SeNet模型推理程序SeNet模型训练程序senet网络结构构建程序开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillowimageio准备工作cifar10数据集下载地址:https://www.cs.toronto.edu/~kriz/cifar.html预训练权重下

2021-12-20 16:44:29 1190

原创 DenseNet代码实现

DenseNet开发环境准备工作项目代码结构cifar10转png程序数据集构建文件模型获取程序DenseNet推理程序DenseNet训练程序Densenet网络结构实现开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillowimageio准备工作cifar10数据集下载地址:https://www.cs.toronto.edu/~kriz/cifar

2021-12-20 16:08:22 364

原创 ResNeXt代码实现

ResNeXt开发环境准备工作项目代码结构开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillowimageio准备工作cifar10数据集下载地址:https://www.cs.toronto.edu/~kriz/cifar.html预训练权重下载地址model_urls = { 'resnet18': 'https://download.

2021-12-20 11:41:27 1051

原创 GooLeNet-V4代码实现

GooLeNet-V4开发环境准备工作项目代码结构开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作Inception-ResNet-v2预训练模型权重下载地址:https://data.lip6.fr/cadene/pretrainedmodels/inceptionresnetv2-520b38e4.pthInception-V4预训练

2021-12-20 10:33:00 630

原创 ResNet代码实现

ResNet开发环境准备工作项目代码结构cifar10数据集转换(解析)程序cifar10数据集构建程序ResNet模型获取程序resnet推理demo程序resnet训练程序resnet网络结构程序开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作ResNet预训练模型下载地址:https://download.pytorch.org/mo

2021-12-17 19:32:18 1519

原创 GooLeNet-V3

GooLeNet-V3一级目录二级目录三级目录一级目录二级目录三级目录

2021-12-17 16:48:24 1248

原创 BN层代码实现

Batch Normalization开发环境项目代码结构生成虚拟数据程序神经网络构建带初始化模型的神经网络构建带BN的FC网络和不带BN的FC网络对比不同初始化方式带BN的网络模型对比开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow项目代码结构src文件夹存储了带有BN的FC训练文件、基于初始化的带BN的FC训练文件以及BN在训练阶段的操作。t

2021-12-15 19:36:19 3063

原创 GooLeNet-V1代码实现

GooLeNet-V1开发环境准备工作项目代码结构海洋渔业分类数据集构建程序GooLeNet模型获取程序GooLeNet模型获取程序GooLeNet推理demo程序GooLeNet训练程序GooLeNet网络结构构建程序开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作GooLeNet-V1预训练模型,下载地址:https://downloa

2021-12-15 11:34:06 1994

原创 VGG代码实现

VGG代码实现开发环境准备工作项目代码结构猫狗数据集构建程序vgg16模型获取程序VGG推理demo程序VGG猫狗数据集训练程序VGG网络结构代码开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作alexnet预训练模型,下载地址:https://download.pytorch.org/models/alexnet-owt-4df8aa71.p

2021-12-08 19:53:14 2314 1

原创 AlexNet代码实现

AlexNet代码开发环境准备工作三级目录开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作alexnet预训练模型三级目录

2021-12-08 09:26:11 731 2

原创 CV-transformer

CV-transformerVIT二级目录三级目录VITtransformersequence结构采用的是RNN网络,后面时刻的信息依赖于前一时刻,存在无法并行运算的问题。CNN没有时序上的依赖可以进行并行运算,但CNN倾向于提取局部信息,没有全局视野。Transformer的优势:并行运算、全局视野、灵活堆叠能力。二级目录三级目录...

2021-12-02 20:46:30 1290 2

原创 CV-轻量化网络

CV-轻量化网络mobileNet二级目录三级目录mobileNet二级目录三级目录

2021-11-27 20:17:04 2635

原创 CV-目标检测总结

目标检测总结目标检测常用数据集指标目标检测论文:A Survey of Modern Deep Learning based Object Detection Models目标检测:在图像或视频中,找到目标位置并进行分类。其需要识别并定位视野中某个目标的所有实例,即目标检测目的是检测出图像中所有实例的类别,并用一个轴对齐的矩形框大致给出实例的位置。在早期,目标检测模型是通过集成一系列手工设计的特征提取器来构造的,但这些模型速度慢、精度低、跨域性能差。近年来,基于CNNs的目标检测模型改变了视觉领域的

2021-11-20 21:13:01 3201

原创 CV-目标检测

CV-目标检测个人数据集标签制作目标检测Yolov1YoloV2 算法个人数据集标签制作labelimg:图像标注工具目标检测目标检测:通过输入的图像来完成物体的检测,它需要解决的两个问题:物体在哪里(位置)和物体是什么(类别)。分类的损失和评价指标:损失函数:交叉熵损失函数评估指标:Accuracy检测的损失和评价指标评估指标:IOU(交并比)基于深层神经网络的目标检测双阶段:第一级网络用于候选区域提取;第二级网络对提取的候选区域进行分类和精确坐标回归。单阶段:摒弃了候选区域

2021-11-19 11:21:24 2549

原创 CV--baseline

CV--baselineAlexNet(基于深度卷积神经网络的图像分类)VGGGoogleNetAlexNet(基于深度卷积神经网络的图像分类)网络结构图:AlexNet特点:RELU激活函数relu(x) = max(0, x).relu可以使网络训练更快、防止梯度消失,使网络具有稀疏性。多GPU训练LRN(local response normalization)局部响应标准化:提高网络的泛化能力,受神经元侧抑制启发,即细胞分化变为不同时,会对周围细胞产生拟制信号,阻止他们向相同

2021-11-08 10:54:01 302

原创 数字图像处理1

数字图像处理1数字图像处理数字图像表示图像类型数字图像处理图像可以定义为一个二维函数f(x,y)f(x,y)f(x,y),其中xxx和yyy是空间坐标,而fff在任意坐标(x,y)(x,y)(x,y)处的幅度称为图像在该点处的亮度或灰度。当x、yx、yx、y和fff的幅值都是有限的离散值时,称该图像为数字图像。数字图像是由有限数量的元组组成的,每个元素都有一个特殊的位置和数值,这些元素称为图片元素、图像元素和像素。图像处理的三种类型:低级、中级、高级。低级处理包括原始操作,如降低噪声的图像预处理

2021-11-05 15:07:20 1775

原创 C++ 3

C++ 3C++数据结构C++面向对象三级目录C++数据结构结构是c++中另一种用户自定义的可用的数据类型,允许用户存储不同类型的数据项。结构定义: struct语句struct type_name{member_type1 member_name1;member_type2 member_name2;member_type3 member_name3;}object_names;type_name是 结构体类型的名称, member_type1 member_name1;是标准的变

2021-11-04 21:19:55 530

原创 C++ 2

C++ 2C++循环C++判断语句C++函数c++数学运算c++数组c++字符串c++指针C++ 引用c++日期和时间c++基本输入输出C++循环循环类型循环控制语句while循环while(condition){ statements;}for循环for(init;condition;increment){ statements;}do…while循环do{ statements;}while(conditions);C++判断语句if(conditio

2021-11-03 21:31:26 425

原创 C++ 1

C++基础语法C++C++关键字C++注释C++数据类型c++变量类型C++ 常量C++C++在C的基础上增添了面向对象编程和泛型编程。是一种静态类型、编译式、通用的、大小写敏感的、不规则的编程语言。C++支持面向对象的程序设计及其四大特性:封装、抽象、继承、多态。C++关键字asm 指令字符串:允许在C++程序中嵌入汇编代码auto 存储类型标识符,表明变量自动具有本地范围,块范围的变量声明默认为auto存储类型。bool bool类型(true false)(布尔类型)break 中

2021-11-03 10:53:21 397

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除