自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(81)
  • 收藏
  • 关注

原创 计算机视觉——Opencv(人脸检测)

在开始编码前,我们先理解人脸检测的核心逻辑,让学习更有方向。本项目基于 OpenCV 内置的实现人脸检测,这是一种经典且高效的目标检测算法,专门针对人脸、眼睛、车辆等目标优化,具有速度快、轻量化、易部署的特点,非常适合入门学习。

2026-03-24 17:09:06 1275 4

原创 计算机视觉——Opencv(摄像头实时风格迁移)

将摄像头实时画面分割成四个方格,每个方格应用不同的艺术风格滤镜,最后拼接成一个完整画面展示出来:调用电脑默认摄像头,持续获取原始视频帧;:对高分辨率原始帧进行缩放,从根源降低计算压力,避免卡顿;:将缩放后的画面均匀切分为左上、右上、左下、右下四个等大区域;:为四个象限分别加载不同的艺术风格模型,独立完成风格转换;:将处理后的四个艺术化区域重新拼接,实时显示最终效果,并支持按键退出。

2026-03-23 16:55:23 440

原创 计算机视觉——Opencv(物体跟踪)

跟踪标志,默认为False# 打开默认摄像头(通常编号为0)tracking:布尔型标志位,控制跟踪的开启与关闭,False表示未开始跟踪;:打开摄像头设备。参数0代表默认摄像头,若有多个摄像头,可改为 1、2 切换;若要处理视频文件,可传入视频路径(如。

2026-03-17 22:26:39 846 1

原创 计算机视觉——Opencv(模块风格迁移)

风格迁移的核心原理源于卷积神经网络(CNN)对图像特征的提取能力:通过算法分离图像的与,再将两者重新组合,生成兼具原始内容与艺术风格的全新图像。从技术落地来看,借助 OpenCV 的 DNN 深度神经网络模块,搭配预训练好的风格迁移模型,就能快速实现这一效果。

2026-03-17 21:52:09 617 1

原创 计算机视觉——Opencv(实现抠图功能)

我们将以下面这张图作为示例,目标是提取图像中最大的物体区域,并保存成一张新图片。

2026-03-16 18:06:53 456

原创 本地部署千问大模型

大家可以从魔搭社区平台,下载各种版本的各种大模型,尽量能在自己的电脑上运行,所以这边下载1.5B的版本下载后的文件夹里的东西不要动即可。

2026-03-16 17:15:55 182

原创 Yolo目标检测——从YOLO V1~V5

英文全称是(Mean Average Precision),是综合衡量检测效果的核心指标,其计算基于 IoU、精确率(Precision)和召回率(Recall)。

2026-03-12 19:57:35 344

原创 Git分支与版本控制

分支类型命名规范用途主分支main或master存放稳定、可发布的代码(核心分支)开发分支dev/或develop/团队日常开发的分支(所有功能先合到这)功能分支开发单个新功能(比如 feature-login)Bug 修复分支bugfix/xxx修复开发中的 Bug紧急修复分支hotfix/xxx修复线上已发布版本的紧急 Bug。

2026-03-09 23:20:03 466

原创 GitHub仓库创建与基本代码提交

执行后终端提示,说明初始化成功。

2026-03-09 21:01:53 275

原创 GitHub账号注册与SSH配置

(用户名、邮箱、密码设置)国内QQ邮箱 网易邮箱、国外谷歌邮箱、苹果账号。

2026-03-06 19:02:22 510

原创 计算机视觉——Opencv(光流估计实现目标追踪)

是空间运动物体在观测成像平面上的像素运动的“瞬时速度”,根据各个像素点的速度矢量特征,可以对图像进行动态分析,例如目标跟踪。

2026-03-06 14:24:27 14102

原创 计算机视觉——Opencv(背景建模实现目标检测)

指在计算机视觉中,从视频序列中提取出静态背景的一种技术。在视频中,背景通常被定义为相对稳定的部分,例如墙壁、地面或天空等。背景建模的目标是将动态的前景对象与静态的背景进行分离,以便进一步分析和处理。

2026-03-04 16:11:22 944 1

原创 计算机视觉——Opencv(摄像头动态轮廓识别)

在数字化办公场景中,文档扫描是高频需求 —— 无论是纸质合同、手写笔记还是纸质报表,都需要快速转化为规整的数字格式。传统扫描仪操作繁琐,而手机 / 电脑摄像头扫描又容易因拍摄角度导致文档变形。本文将手把手教你用 Python+OpenCV 实现,无需专业硬件,只需几行代码就能完成从画面捕捉、边缘检测到透视变换的全流程,最终输出规整的文档图像。

2026-03-04 15:20:31 259

原创 计算机视觉——Opencv(答题卡识别并打分)

import cv2# 正确答案映射(题目索引:正确选项索引)

2026-02-28 17:59:06 1064 1

原创 计算机视觉——Opencv(图像拼接)

图像拼接的本质是解决和两个核心问题。基于透视变换的双图拼接,核心依赖和:用 SIFT 算法检测图像的特征点和描述符(具有尺度不变性);:通过暴力匹配器筛选优质匹配对,剔除错误匹配;:计算单应性矩阵(Homography),将右图映射到左图的坐标系;:将变换后的右图与左图拼接,生成最终全景图。

2026-02-07 15:23:37 1222

原创 计算机视觉——Opencv(指纹认证和指纹识别)

在计算机视觉领域,是实现图像认证、目标识别、指纹 / 人脸验证等功能的核心技术,而 SIFT 结合 FLANN 的匹配方案,因具备尺度不变、旋转不变的鲁棒性和高效的匹配速度,成为此类项目的经典选择。

2026-02-06 17:33:10 1140

原创 计算机视觉——Opencv(角点检测和特征提取)

SIFT(Scale Invariant Feature Transform)尺度不变特征变换。SIFT特征具有对旋转、尺度缩放、亮度变化等保持不变性,是一种非常稳定的局部特征。

2026-02-04 15:43:03 1333

原创 计算机视觉——Opencv(图像透视变换)

我们经常需要将纸质文档转换为电子档,但拍摄的文档照片往往存在倾斜、透视畸变等问题,导致文档内容歪斜、不易识别。想要解决这个问题,就需要用到它能够将不规则的四边形区域映射为规整的矩形,完美消除透视畸变,广泛应用于文档矫正、车牌识别、全景拼接等场景。本文将通过一个完整案例,从图像读取、轮廓检测,到透视变换、结果后处理,逐步完成发票/文件的自动矫正。

2026-02-03 19:53:33 1222 1

原创 计算机视觉——Opencv(直方图均衡化)

直方图均衡化:是一种图像增强技术,它可以通过增加图像的对比度和亮度来改善图像的质量。实现方法:通过将图像的像素值分布均匀化来实现这一目标。在Python OpenCV中,可以使用cv2.equalizeHist()函数来实现直方图均衡化。

2026-02-02 10:56:55 1107

原创 计算机视觉——Opencv(图像直方图与掩膜)

直方图:是图像中像素强度分布的图形表达方式。直方图的作用:例如视频中,通过标记帧和帧之间显著的边缘和颜色的统计变化,来检测视频中场景的变换。灰度值在0 - 255范围之间总共 256 个值,可以将我们的范围划分为子部分(称为bins)直方图均衡化:是一种图像增强技术,它可以通过增加图像的对比度和亮度来改善图像的质量。实现方法:通过将图像的像素值分布均匀化来实现这一目标。在Python OpenCV中,可以使用cv2.equalizeHist()函数来实现直方图均衡化。

2026-02-02 10:23:11 616

原创 计算机视觉——Opencv(图像金字塔)

是由一幅图像的多个不同分辨率的子图构成的图像集合。是通过一个图像产生的,最小的图像可能仅仅有一个像素点。图像金字塔的底部是待处理的高分辨率图像(原始图像),而顶部则为其低分辨率的近似图像。

2026-01-31 14:53:13 942

原创 计算机视觉——Opencv(身份证号识别)

模板构建:利用标准数字图像,建立模板库。图像预处理:灰度化 → 顶帽操作 → 闭运算 → 二值化,得到清晰的卡号区域。区域筛选:根据宽高比和大小,精确定位卡号段。逐位识别:通过模板匹配,识别每一位数字。结果展示:输出卡种 + 卡号,并可视化标注。

2026-01-30 15:09:16 545

原创 计算机视觉——Opencv(银行卡号识别)

myutils.py。

2026-01-30 09:32:38 843

原创 计算机视觉——Opencv(模板匹配)

模板匹配是一种用于查找与模板图像(补丁)匹配(相似)的图像区域的技术。具体来说,模板匹配需要准备两张图:一张是,也就是我们要从中寻找目标的完整大图;另一张是,也就是我们要找的目标物体的单独截图。算法会将模板图像像一个 “滑动窗口” 一样,在源图像上从左到右、从上到下依次滑动遍历,每滑动到一个位置,就会通过特定的计算方法,判断该位置的图像与模板图像的匹配程度,最终找到匹配程度最高的位置,也就是目标物体在源图像中的所在之处。

2026-01-29 13:54:55 991

原创 计算机视觉——Opencv(郁金香图像轮廓提取与多边形逼近)

,表示反向二值化,即像素值低于阈值的设置为 255(白色),高于阈值的设置为 0(黑色)。绘制红色原始轮廓,再调用一次该函数绘制绿色近似轮廓,OpenCV 会自动将两种轮廓叠加在同一张图上,红色和绿色对比清晰,能直观看到轮廓近似的简化效果。),表示压缩轮廓点,只保留轮廓的关键点(如直线的端点、曲线的拐点),能够大幅减少轮廓点的数量,节省内存空间。),表示只提取最外层的轮廓,忽略内部的子轮廓,这正是我们需要的郁金香外部轮廓;(红色的为原始轮廓,绿色的为近似轮廓)第一个参数:待二值化的灰度图像(

2026-01-28 17:21:26 503

原创 计算机视觉——Opencv(轮廓检测+轮廓特征+轮廓近似)

轮廓是图像中,是区别于边缘检测的关键概念边缘检测仅提取灰度突变的离散像素点,而轮廓强调闭合性与整体性,能完整描述物体的形状边界。OpenCV 处理轮廓有一个硬性前提 ——(黑白两色)。因为二值化通过阈值分割将目标物体与背景完全分离,消除颜色、灰度渐变的干扰,让计算机能精准识别物体边界。因此,轮廓处理的为:图像读取→灰度转换→二值化→轮廓检测→特征分析→轮廓近似,后续所有操作均围绕提取的轮廓集合展开。

2026-01-27 17:13:52 1340

原创 计算机视觉——Opencv(边缘检测)

梯度计算会产生正负值(比如从亮到暗为负,从暗到亮为正),但图像像素值的显示范围是 0-255(uint8 类型),负数会被直接截断为 0,导致部分边缘信息丢失。Sobel 算子的核心是通过两个 3×3 的卷积核(分别对应 X、Y 方向),与图像进行卷积运算,计算出每个像素点的梯度值,梯度值越大,说明该点越可能是边缘。Scharr 算子是 Sobel 算子的改进版本,使用更大的卷积核(3×3),对边缘的检测精度更高,尤其适合高分辨率图像或需要精细边缘的场景。X 方向梯度:检测垂直边缘(像素值在水平方向突变)

2026-01-26 15:20:04 1206

原创 计算机视觉——Opencv(图像形态学)

图像形态学是一种处理图像形状特征的图像处理技术,主要用于描述和处理图像中的形状和结构。形态学可以用于提取图像中的特征、消除噪声、改变图像的形状等。图像形态学的本质是利用结构元素(Kernel)对图像中的像素集合进行遍历和运算,结构元素可以理解为一个固定大小的矩阵(常见 3×3、5×5),决定了形态学操作的作用范围和强度。在 OpenCV 中,我们通常使用np.ones()创建结构元素,数据类型需指定为np.uint8(8 位无符号整数,符合图像像素值的存储格式)。

2026-01-25 21:18:02 1027

原创 计算机视觉——Opencv(图像平滑处理)

(Image Smoothing)是一种核心的预处理技术,也被称为,其本质是的过程。下面是常用的一些滤波器:1、均值滤波(Blur)2、方框滤波(BoxFilter)3、高斯滤波(GaussianBlur)4、中值滤波(MedianBlur)

2026-01-24 15:22:34 1508 1

原创 计算机视觉——Opencv(基础操作二)

基于 Numpy 数组的元素级运算,每个像素的 BGR 三个通道值分别参与运算注释:c=a+10,表示给a图像的所有像素值+10c = a[50:200,50:250]+b[50:200,50:250],表示参与运算的图像区域。

2026-01-23 17:04:47 1401

原创 机器学习——TF-IDF实战(红楼梦数据处理)

有上图可知,我们的文本中存在电子书.......,章节内容开始......,和一些网址广告,所以我们对他们进行相应处理。

2026-01-22 15:30:03 540

原创 计算机视觉——Opencv(基础操作一)

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库。它包含大量优化算法,涵盖图像处理、物体检测、人脸识别、3D重建等任务。支持多种编程语言(如C++、Python、Java),并可在Windows、Linux、macOS等平台上运行。

2026-01-22 00:10:34 1433

原创 深度学习——卷积神经网络实现手写数字识别

''' 定义神经网络 类的继承这种方式'''nn.ReLU(),nn.ReLU(),nn.ReLU(),nn.ReLU(),nn.ReLU(),nn.ReLU(),模型结构说明:输入1*28*28(64 张图片作为一个批次。故 64*1*28*28)conv1(一维):卷积 + ReLU + 池化 → 输出 16*14*14conv2(二维):多层卷积 + ReLU + 池化 → 输出 32*7*7conv3(三维):卷积层 → 输出 64*7*7。

2026-01-19 10:42:11 712

原创 机器学习——PCA数据降维

数据的特征又叫做数据的维度,减少数据的特征即降维如何做到最好的降维效果?减少数据维度的同时,能较好地代表原始数据。1. 将原始数据按列组成n行m列矩阵X;2.将X的每一行(代表一个属性字段)进行零均值化, 即减去这一行的均值3.求出协方差矩阵:4.求出协方差矩阵的特征值及对应的特征向量;5.将特征向量按对应特征值大小从上到下按行排列 成矩阵,取前k行组成矩阵P;6.Y=PX即为降维到k维后的数据。

2026-01-16 17:54:20 1000

原创 深度学习——卷积神经网络CNN

对图像(不同的窗口数据)和卷积核(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。

2026-01-15 20:05:05 1848

原创 机器学习——词向量转化和评论判断项目分析

continue。

2026-01-14 23:07:33 1426

原创 机器学习——自然语言处理之关键词提取任务(TF-IDF)

(1)语料库中存放的是在语言的实际使用中真实出现过的语言材料;(2)语料库是以电子计算机为载体承载语言知识的基础资源;(3)真实语料需要经过加工(分析和处理),才能成为有用的资源。

2026-01-12 16:27:21 1413

原创 机器学习——DBSCAN算法

K-means算法的优点:简单,快速,适合常规的数据集缺点:k值难以确定,很难发现任意形状的簇针对K-means算法的缺点,我们来介绍新的DBSCAN算法。

2026-01-09 11:22:02 856

原创 深度学习----PyTorch框架(手写数字识别案例)

常用的有:Caffe,TensorFlow,Keras,PyTorcCaffe:优点:只需要配置文件即可搭建深度神经网络模型缺点:安装麻烦,缺失很多新网络模型,近几年几乎不更新TensorFlow:由Google公司开发:1.x版本:缺点:代码比较冗余,上手有难度2.x版本:收购了keras,代码不兼容1.x版本Keras:基于 TensorFlow 封装优点:简化代码难度。PyTorch:Facebook(现 Meta )开发优点:上手极容易,直接套用模板。

2026-01-05 18:41:49 941

原创 深度学习入门(神经网络)

神经网络:每个节点代表一种特定的是由大量的节点(或称“神经元”)和之间相互的联接构成。输出函数:称为激励函数、激活函数(activation function)。每两个节点间的联接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。

2026-01-05 00:01:19 1031

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除