2025最新Python机器视觉实战：基于OpenCV与深度学习的多功能工业视觉检测系统（附完整代码）

全息架构师

于 2025-02-19 22:51:04 发布

阅读量1.3k

点赞数 16

分类专栏： AI 行业应用实战先锋文章标签： python opencv 深度学习

本文链接：https://blog.csdn.net/weixin_42358373/article/details/145741137

版权

2025最新Python机器视觉实战：基于OpenCV与深度学习的多功能工业视觉检测系统（附完整代码）

摘要：本文基于OpenCV与深度学习模型，实现一个多功能工业视觉检测系统，包含缺陷检测、尺寸测量、颜色识别、OCR文本识别、目标分类与数据可视化等功能。代码兼容Python 3.7+，功能丰富且经过稳定性测试，适合工业场景应用。所有依赖库均为最新版本，确保运行流畅。

一、环境准备

安装依赖库

pip install opencv-python==4.9.0  # OpenCV库
pip install torch==2.0.0         # PyTorch深度学习框架
pip install torchvision==0.15.0  # 图像处理库
pip install pytesseract==0.3.10  # OCR文本识别库
pip install pandas==2.0.0        # 数据存储库
pip install matplotlib==3.7.0    # 可视化库
pip install scikit-image==0.21.0 # 图像处理工具库

下载预训练模型
- 模型文件：resnet18.pth（用于目标分类）
- 下载地址：PyTorch官方模型库
配置Tesseract OCR
- 安装Tesseract OCR引擎：Tesseract安装指南
- 配置环境变量：确保pytesseract能找到Tesseract可执行文件。

二、代码实现与步骤解析

步骤1：加载模型与初始化参数

import cv2
import torch
import torchvision.transforms as transforms
from torchvision.models import resnet18
import pytesseract
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from skimage.measure import label, regionprops

# 加载预训练ResNet18模型
model = resnet18(pretrained=False)
model.load_state_dict(torch.load("resnet18.pth"))
model.eval()

# 定义图像预处理
transform = transforms.Compose([
    transforms.ToPILImage(),
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

# 初始化全局变量
detection_results = []  # 检测结果存储