自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 数据预处理

使用os.path.splitext来获取文件名和扩展名。print(f"地址为:{src_path}")范围在(-20°, 20°) 表示向左向右旋转。# 在文件名后添加角度和扩展名。范围是原来的(0.8,1.2)之间。print('开始切分数据集')print('完成切分数据集')人脸中心点加强或者变暗。

2024-04-18 10:50:29 254 1

原创 卷积神经网络杂记

方法二:深度学习(自动提取特征)--卷积神经网络(CNN),自注意力机制(transformer)输入图像-->卷积神经网络提取图片特征向量-->特征向量输入MLP-->输出类别。方向二:对于第一次经过卷积神经网络训练完成的图像进行二次卷积神经网络,方向三:对于输入图像进行设计降噪方案,例如高斯,中值,双边滤波等。方法二:对于输入图像进行,旋转偏移等特定移动空间位置等信息操作。方法一:传统算法(手工提取特征)--HOG,SIFT等。方法一:输入图像进行裁剪,设计特定裁剪方式。4.输出:类别(label)

2024-02-26 11:51:29 227 1

原创 opencv图像滤波

Scharr算子对噪声的敏感性较低,相对于Sobel算子,它具有更强的边缘响应,相较于sobel算子,scharr算子也有着自适应的卷积核大小。Prewitt算子和Roberts算子没有单独函数,他们同时都是自定义卷积核进行计算,Prewitt算子类似于Sobel算子,分为水平和垂直两个方向。Sobel算子是一种常用的梯度算子,用于图像的边缘检测。它分为水平方向和垂直方向两个卷积核,分别用于检测图像在水平和垂直方向上的梯度。平滑操作是通过卷积核的权重对图像进行平均化,来降低图像的高频噪声,实现图像平滑化。

2024-02-24 09:00:00 1184 1

原创 opencv的几何变换

图像的几何变换就是将一组图像数据经过某种数学运算,映射成另外一组图像数据的操作。所以,

2024-02-23 09:00:00 1760 1

原创 opencv进阶操作-2

调整亮度是通过增加或减少图像的像素值来改变图像的明亮度。增加像素值会使图像变得更亮,减少像素值会使图像变暗。裁剪是指从图像中剪切出感兴趣的区域,去除不需要的部分。这种操作通常用于调整图像的尺寸和去除不必要的背景。调整对比度是通过增加或减少图像中像素值的差异来改变图像的对比度。随机变换是指对图像进行随机的变换操作,如随机旋转、随机缩放、随机翻转等,用于增加数据的多样性和鲁棒性。平移是指沿着图像的水平或垂直方向移动图像的像素。色彩变换是通过改变图像的色彩空间或调整图像的色调、饱和度和亮度来改变图像的外观。

2024-02-22 09:00:00 789

原创 opencv进阶操作-1

二值化是将图像转换为只包含两个像素值(一般为0和255,或者0和1)的过程。这种转换有助于简化图像,并突出显示图像中的目标。在二值图像中,目标通常以白色(255或1)表示,而背景以黑色(0)表示。二值化通常用于处理灰度图像,其中每个像素的灰度值表示其亮度。通过设定一个阈值,低于阈值的像素被设为一个值,而高于阈值的像素被设为另一个值,从而实现二值化。常见二值化的方法分为全局阈值和局部阈值(自适应阈值)。全局固定阈值化:对整幅图像都是用一个统一的阈值来进行二值化;

2024-02-21 09:00:00 1461 1

原创 opencv基本操作-2

【代码】opencv基本操作-2。

2024-02-20 12:56:32 111 1

原创 opencv基本操作-1

1999年,在英特尔公司工作的Gary Bradski发布了OpenCV,希望为在该领域工作的人提供基础架构来加速计算机视觉和人工智能的发展。OpenCV库包含超过500个涵盖视觉领域的功能,包括产品检测,医疗成像,安全性,用户界面,摄像机校准,立体视觉和机器人。如果安装了该库,OpenCV会在运行时自动使用相应的IPP库。格式,其中height表示图像的高度(行数),width表示图像的宽度(列数),channels表示图像的通道数,通常表示为3(分别表示RGB(红绿蓝)三个颜色通道)。

2024-02-20 11:05:27 942

关于不同人脸训练数据集

关于不同人脸训练数据集

2024-02-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除