为算法工程师-CSDN博客

图像特征与描述1.颜色特征1.1 量化颜色直方图1.2 聚类颜色直方图问题2.几何特征：边缘问题3.基于特征点的特征描述子1.颜色特征见1.1及2.1颜色特征提取1.1 量化颜色直方图适用于RGB、HSV等颜色空间。操作：颜色空间量化，单位（bin）由单元中心代表，即统计落在量化单元上的像素数量最常用的方法是将颜色空间的各个分量（维度）均匀地进行划分。1.2 聚类颜色直方图适用Lab等颜色空间。操作：使用聚类算法对所有像素点颜色向量进行聚类，单元（bin）由聚类中心代表。聚类算法则考虑到

2022-04-17 19:14:32 2811

原创图像预处理

图像预处理

2022-04-17 14:36:54 6130

原创目标检测--评价指标

目标检测--评价指标1. 评价指标1. 评价指标

2022-04-12 15:51:46 3136

原创图像数据格式

图像数据预处理1. 图片格式1. 图片格式

2022-04-01 16:59:12 7902

原创图像特征总结（三）

图像特征总结（三）1. LBP特征提取方法总结1. LBP特征提取方法总结Histogram：图像对比度是通过灰度级范围来度量的，而灰度级范围可通过观察灰度直方图得到，灰度级范围越大代表对比度越高；反之，对比度越低，低对比度的图像在视觉上给人的感觉是看起来不够清晰，所以通过算法调整图像的灰度值，从而调整图像的对比度是有必要的。GLCM：灰度共生矩阵用于描述纹理特征。Color：颜色空间转换ShapeContext：形状上下文特征，基于物体轮廓样本点进行描述的，具体来说是基于计算形状相似性以及点与

2022-03-30 10:50:05 820

原创图像特征总结（二）

图像特征总结（二）1.Histogram（直方图）特征1.1 直方图均衡化1.2 直方图规定化2.3 例子2. GLCM（灰度共生矩阵）2.1GLCM原理参考资料链接1.Histogram（直方图）特征灰度直方图是最简单、有用的工具之一。从对图像的分析与观察，直到形成一个有效的处理方法，都离不开直方图。直方图：表示数字图像中每一灰度级像素出现的频次（该灰度级的像素数目）。p(k)=nkp(k) = n_kp(k)=nk，nkn_knk是图像中第k个灰度级的像素总数。或者p(rk)=nknp(r_

2022-03-28 16:23:32 8021

原创图像特征总结（一）

图像特征总结1.Histogram（直方图）特征1.1 直方图均衡化1.2 直方图规定化1.3 例子2. GLCM参考资料链接1.Histogram（直方图）特征灰度直方图是最简单、有用的工具之一。从对图像的分析与观察，直到形成一个有效的处理方法，都离不开直方图。直方图：表示数字图像中每一灰度级像素出现的频次（该灰度级的像素数目）。p(k)=nkp(k) = n_kp(k)=nk，nkn_knk是图像中第k个灰度级的像素总数。或者p(rk)=nknp(r_k) = \frac{n_k}{n}p(

2022-03-27 20:46:23 11893 1

原创 opencv--视频操作

opencv--视频操作视频读写1 从文件中读取视频并播放2 保存视频视频读写1 从文件中读取视频并播放在OpenCV中我们要获取一个视频，需要创建一个VideoCapture对象，指定你要读取的视频文件：创建读取视频的对象cap = cv.VideoCapture(filepath)参数：filepath: 视频文件路径视频的属性信息获取视频的某些属性，retval = cap.get(propId)参数：propId: 从0到18的数字，每个数字表示视频的属性。常用属

2022-03-24 21:02:14 5213

原创 opencv--图像特征提取与描述

opencv--图像特征提取与描述1.图像的特征2. Harris和Shi-Tomas算法2.1 Harris角点检测2.1.1 原理2.1.2 实现2.2 Shi-Tomasi角点检测2.2.1原理2.2.2 实现3.SIFT/SURF算算法3.1SIFT算法3.1.1 SIFT原理3.1.2 SIFT算法基本流程3.1.3 尺度空间极值检测3.1.4 关键点定位3.1.5 关键点方向确定3.1.6 关键点描述3.2 SURF原理3.3 实现4.Fast和ORB算法4.1 Fast算法4.1.1 Fast

2022-03-24 19:29:39 2145

原创 opencv--模板匹配和霍夫变换

opencv--模板匹配和霍夫变换1 模板匹配1.1 原理1.2 实现2.霍夫变换2.1 原理霍夫线检测2.3 霍夫圆检测1 模板匹配1.1 原理模板匹配是指在给定的图片中查找和模板最相似的区域，该算法的输入包括模板和图片。其整个任务的思路是按照滑窗，不断地移动模板图片，计算其与图像中对应区域的匹配度，最终将匹配度最高的区域选择为最终的结果。实现流程：准备两幅图像：原图像(I)：在这幅图中，找到与模板相匹配的区域模板（T）：与原图像进行比对的图像块滑动模板图像与原图像进行比对：

2022-03-23 20:39:25 480

原创 opencv--边缘检测

opencv--边缘检测1 边缘检测原理2 Sobel检测算子2.1 Sobel检测方法2.2 应用3 Laplacian算子4. Canny边缘检测4.1 原理4.2应用5 算子比较1 边缘检测原理边缘检测是图像处理和计算机视觉中的基本问题，边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。边缘的表现形式如下所示：优势：图像边缘检测大幅度地减少了数据量，并且剔除了可以认定为不相关地信息，还可以保留图像重要地结构属性。用于边缘检测的方法可以分

2022-03-23 19:50:52 4155

原创 opencv--直方图

opencv--直方图1. 灰度直方图1.1 原理1.2 直方图的计算和绘制1.3 掩膜的作用2 直方图均衡化2.1 原理及应用1. 灰度直方图1.1 原理直方图是对数据进行统计的一种方法，并将统计值组织到一系列事先定义好的bin中。其中，bin为直方图中经常用到的一个概念，即直条或组距，其数值是从数据中计算出的特征统计量。这些数据可以是：梯度、方向、色彩或任何其他特征。图像直方图是用以表示数字图像中亮度分布的直方图，标绘了图像中每个亮度值的像素个数。这种直方图中，横坐标的左侧为较暗的区域，而右侧为

2022-03-23 15:15:59 3387

原创 opencv--图像平滑

opencv--图像平滑1.图像噪声二级目录三级目录1.图像噪声二级目录三级目录

2022-03-22 20:53:23 328

原创 opencv--形态学操作

opencv--形态学操作1 连通性2 形态学操作2.1 腐蚀和膨胀2.1.1 腐蚀2.2 膨胀2.2 开闭运算2.2.1 开运算2.2.2 闭运算2.3 礼帽和黑帽1 连通性图像中，最小的单位为像素，每个像素周围有8个邻接像素，常见的邻接关系有三种：4邻接、D邻接和8邻接。即：4邻接：像素p(x,y)p(x, y)p(x,y)的4邻域是(x+1,y);(x−1,y);(x,y+1);(x,y−1)(x+1, y); (x-1, y); (x, y+1); (x, y-1)(x+1,y);(x−

2022-03-21 21:39:52 1159

原创 opencv--图像处理

opencv--图像处理1. 图像的几何变换1.1 图像缩放1.2 图像平移1.3 图像旋转1.4 仿射变换1.5 透射变换1. 图像的几何变换1.1 图像缩放缩放是针对图像进行大小调整，即图像放大或缩小APIcv2.resize(src,dsize,fx=0,fy=0,interpolation=cv2.INTER_LINEAR)参数：src：输入的图像dsize：绝对尺寸，直接指定调整后图像的大小，为一二维元组（cols， rows），注：图像的shape前两维为（rows，cols）

2022-03-21 19:33:24 2274

原创 opencv--算术操作

opencv--算术操作1. 图像的加法2. 图像的混合三级目录1. 图像的加法API接口cv.add(img1, img2)可以将两幅图相加，或者可以简单地通过numpy操作将两个图像相加，即img=img1 + img2。规定：两个图像应该有相同的大小和数据类型，或者第二个图像为标量值。注：opencv加法和numpy加法之间存在差异，opencv为饱和操作（大于一个上限或小于一个下限，那么最后结果为上限或下限），numpy相加为模运算（大于上限值时，结果为对上限值进行取余）# 8位整数型运算

2022-03-21 14:56:07 935

原创 opencv---基本操作

opencv基本操作1. 图像的IO操作1.1 读取图像1.2 显示图像1.3 保存图像2 绘制几何图形2.1 绘制直线三级目录1. 图像的IO操作1.1 读取图像API接口函数为cv.imread(path, int)，参数为：要读取的图像文件位置读取方式的标志1 表示cv.IMREAD*COLOR：以彩色模式加载图像，任何图像的透明度都将被忽略。是默认参数。0 表示cv.IMREAD*GRAYSCALE：以灰度模式加载图像-1 表示cv.IMREAD_UNCHANGED：包括a

2022-03-21 11:11:53 1247

原创 opencv---介绍

opencv---介绍1. opencv1.1 图像处理简介1.2 数字图像的表示1.2.1 位数1.2.2 图像分类1. opencvopencv是一种开源的图像处理库，包括基本的图像处理方法：几何变换，形态学变换图像平滑直方图操作模糊匹配霍夫变换以及特征提取和描述方法：理解角点特征Harris和Shi-Tomas算法（角点特征）SIFT/SURF算法（尺度不变）Fast算法（快速提取图像特征点）ORB算法（快速进行特征提取并进行特征描述）1.1 图像处理简介模拟图像，即

2022-03-19 15:59:42 909

原创 SSD代码实现

SSDcoco数据集构建文件VOC数据集构建文件三级目录coco数据集构建文件import osimport torch.utils.dataimport numpy as npfrom PIL import Imagefrom ssd.structures.container import Containerclass COCODataset(torch.utils.data.Dataset): class_names = ('__background__',

2022-03-18 14:32:02 825

原创 Yolov3代码实现

Yolov3voc数据集构建文件VOC数据集dataset构建文件VOC2CSVYolov3配置文件模型backbone构建yolo head预测文件conv层模块代码文件残差模块激活函数模块损失函数模块特征金字塔yoloyolov3网络代码构建voc数据集构建文件import sysimport xml.etree.ElementTree as ETimport config.yolov3_config_voc as cfgimport osfrom tqdm import tqdmsys.

2021-12-24 19:52:54 3082 1

原创 SeNet代码实现

SeNet开发环境准备工作项目代码结构cifar10转png程序数据集构建文件SeNet模型推理程序SeNet模型训练程序senet网络结构构建程序开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillowimageio准备工作cifar10数据集下载地址：https://www.cs.toronto.edu/~kriz/cifar.html预训练权重下

2021-12-20 16:44:29 1309

原创 DenseNet代码实现

DenseNet开发环境准备工作项目代码结构cifar10转png程序数据集构建文件模型获取程序DenseNet推理程序DenseNet训练程序Densenet网络结构实现开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillowimageio准备工作cifar10数据集下载地址：https://www.cs.toronto.edu/~kriz/cifar

2021-12-20 16:08:22 452

原创 ResNeXt代码实现

ResNeXt开发环境准备工作项目代码结构开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillowimageio准备工作cifar10数据集下载地址：https://www.cs.toronto.edu/~kriz/cifar.html预训练权重下载地址model_urls = { 'resnet18': 'https://download.

2021-12-20 11:41:27 1167

原创 GooLeNet-V4代码实现

GooLeNet-V4开发环境准备工作项目代码结构开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作Inception-ResNet-v2预训练模型权重下载地址：https://data.lip6.fr/cadene/pretrainedmodels/inceptionresnetv2-520b38e4.pthInception-V4预训练

2021-12-20 10:33:00 845

原创 ResNet代码实现

ResNet开发环境准备工作项目代码结构cifar10数据集转换（解析）程序cifar10数据集构建程序ResNet模型获取程序resnet推理demo程序resnet训练程序resnet网络结构程序开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作ResNet预训练模型下载地址：https://download.pytorch.org/mo

2021-12-17 19:32:18 1677

原创 GooLeNet-V3

GooLeNet-V3一级目录二级目录三级目录一级目录二级目录三级目录

2021-12-17 16:48:24 1359

原创 BN层代码实现

Batch Normalization开发环境项目代码结构生成虚拟数据程序神经网络构建带初始化模型的神经网络构建带BN的FC网络和不带BN的FC网络对比不同初始化方式带BN的网络模型对比开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow项目代码结构src文件夹存储了带有BN的FC训练文件、基于初始化的带BN的FC训练文件以及BN在训练阶段的操作。t

2021-12-15 19:36:19 3219

原创 GooLeNet-V1代码实现

GooLeNet-V1开发环境准备工作项目代码结构海洋渔业分类数据集构建程序GooLeNet模型获取程序GooLeNet模型获取程序GooLeNet推理demo程序GooLeNet训练程序GooLeNet网络结构构建程序开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作GooLeNet-V1预训练模型，下载地址：https://downloa

2021-12-15 11:34:06 2240

原创 VGG代码实现

VGG代码实现开发环境准备工作项目代码结构猫狗数据集构建程序vgg16模型获取程序VGG推理demo程序VGG猫狗数据集训练程序VGG网络结构代码开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作alexnet预训练模型，下载地址：https://download.pytorch.org/models/alexnet-owt-4df8aa71.p

2021-12-08 19:53:14 2564 1

原创 AlexNet代码实现

AlexNet代码开发环境准备工作三级目录开发环境python–3.7torch–1.8+cu101torchsummarytorchvision–0.6.1+cu101PILnumpyopencv-pythonpillow准备工作alexnet预训练模型三级目录

2021-12-08 09:26:11 1068 2

原创 CV-transformer

CV-transformerVIT二级目录三级目录VITtransformersequence结构采用的是RNN网络，后面时刻的信息依赖于前一时刻，存在无法并行运算的问题。CNN没有时序上的依赖可以进行并行运算，但CNN倾向于提取局部信息，没有全局视野。Transformer的优势：并行运算、全局视野、灵活堆叠能力。二级目录三级目录...

2021-12-02 20:46:30 1562 2

原创 CV-轻量化网络

CV-轻量化网络mobileNet二级目录三级目录mobileNet二级目录三级目录

2021-11-27 20:17:04 3205

原创 CV-目标检测总结

目标检测总结目标检测常用数据集指标目标检测论文：A Survey of Modern Deep Learning based Object Detection Models目标检测：在图像或视频中，找到目标位置并进行分类。其需要识别并定位视野中某个目标的所有实例，即目标检测目的是检测出图像中所有实例的类别，并用一个轴对齐的矩形框大致给出实例的位置。在早期，目标检测模型是通过集成一系列手工设计的特征提取器来构造的，但这些模型速度慢、精度低、跨域性能差。近年来，基于CNNs的目标检测模型改变了视觉领域的

2021-11-20 21:13:01 3396

空空如也

空空如也