- 博客(233)
- 资源 (43)
- 收藏
- 关注
原创 项目实践21—全球证件智能识别系统(从sift改为ORB算法)
本文提出了一种改进的证件识别方法,通过将SIFT算法替换为ORB算法并优化预筛选流程,显著提升了识别准确率和效率。原方案使用EfficientNet筛选top1模板后采用SIFT进行验证,存在5%的误判率。改进方案采用EfficientNet筛选top3模板(去重后),再使用ORB算法进行相似度匹配,选择内点数最高的结果。ORB算法相比SIFT具有显著速度优势(快10-100倍),且对证件边缘特征更敏感,能有效降低误判率。实验表明,该方法在保持高效的同时,解决了原方案5%的错误识别问题。
2026-03-03 17:29:04
366
原创 FastAPI的Alembic踩坑记录:缺失历史迁移脚本如何保留数据重建版本控制
摘要:本文针对FastAPI+SQLModel项目中直接拷贝SQLite数据库导致Alembic迁移失败的问题,提出解决方案。核心思路是通过清除数据库中的旧版本记录,生成基准脚本并使用stamp head命令重建版本链。具体步骤包括:删除alembic_version表、暂时隐藏新模型生成初始脚本、恢复新模型生成实际迁移。该方法能在保留历史数据的同时修复版本控制问题,为ORM迁移提供实用技巧。
2026-02-23 19:42:09
452
原创 基于Qwen3-VL-Embedding-2B与vLLM构建高精度多模态图像检索系统
本文提出了一种基于Qwen3-VL-Embedding-2B模型和vLLM推理框架的图像检索系统构建方法。系统采用微服务架构,通过WSL2 Ubuntu环境配置GPU计算能力,利用Docker容器部署模型推理服务。Qwen3-VL-Embedding-2B模型具备强大的OCR识别和细节理解能力,支持指令引导的特征提取。业务应用层基于FastAPI实现图像上传、向量存储和相似度检索功能。该系统解决了传统图像检索中细粒度理解不足、文字识别能力弱等问题,在私有化部署场景下展现出高性能和精准检索的优势。
2026-02-11 21:05:43
655
原创 项目实践20—全球证件智能识别系统(开发辅助采集工具)
本文介绍了一款基于Python开发的证件样本采集辅助工具,旨在解决人工采集流程效率低下的问题。该工具通过剪贴板监听和全局热键技术实现自动化操作,主要功能包括:1)自动创建三级目录结构(国家/地区/版本);2)标准化图像处理,统一横竖版证件尺寸;3)智能文件命名与版本增量存储;4)支持Ctrl+F1-F4热键快速保存不同光源类型的图像。技术栈采用PyQt6、Pillow和pynput等库,实现GUI界面、图像处理和键盘监听功能,显著提升了证件样本采集的效率和规范性。
2026-02-08 17:24:10
620
原创 项目实践19—全球证件智能识别系统(优化检索算法:从MobileNet转EfficientNet,并开发测试页面)
本文介绍了在证件智能识别系统中将特征提取网络从MobileNetV3升级为EfficientNet-B3的技术方案。EfficientNet-B3具有300x300的标准输入分辨率,约47M参数,在保持较快推理速度的同时显著提升了特征提取能力。方案采用广义平均池化(GeM)替代传统平均池化,通过可学习参数p自适应聚焦证件图像中的关键区域(如Logo、印章),并配合度量学习进行全流程微调。文中详细阐述了网络架构设计,包括EfficientNet-B3的特征提取层、GeM池化层实现和投影头结构,同时提供了适配3
2026-01-24 18:47:41
1083
原创 项目实践18—全球证件智能识别系统(优化检索模块)
摘要: 针对证件识别系统中MobileNetV3全局特征检索在“版式相同但内容不同”场景下的精度波动问题,提出双阶段改进方案:第一阶段通过MobileNet特征相似度分组聚合筛选Top-5候选模板;第二阶段引入SIFT+RANSAC算法,通过灰度化预处理和局部特征点匹配,结合几何验证排除可变内容干扰。方案利用SIFT的尺度不变性和纹理细节聚焦特性,有效提升证件版式识别鲁棒性。代码实现封装了独立的特征匹配模块,支持灰度转换、FLANN匹配及RANSAC内点统计,后端服务通过分组筛选优化候选集多样性。实验表明该
2026-01-22 08:39:08
625
原创 项目实践17—全球证件智能识别系统(开发基于LabelMe标注的可视化审核接口)
本文实现了一个全球证件智能识别系统的可视化审核功能。主要内容包括:1) 扩展数据模型,新增字段存储LabelMe生成的JSON版面标注数据;2) 更新数据库迁移脚本和初始化程序,支持标注文件导入;3) 开发FastAPI后端接口,结合Canvas实现交互式HTML页面渲染。系统通过鼠标悬停可高亮显示证件字段区域,辅助人工审核人员快速定位关键信息。
2026-01-19 16:26:43
921
原创 项目实践16—全球证件智能识别系统(为手机端提供证件预处理服务)
摘要 本文介绍了一个基于Docker容器化部署的证件图像预处理微服务系统。针对移动端上传的国外证件图像存在的背景复杂、倾斜、光照不均等问题,系统采用通义实验室的cv_resnet18_card_correction模型进行证件检测与透视矫正,并结合PaddleOCR的文本方向分类模型实现自动旋转。通过Docker隔离环境依赖,确保模型稳定运行,单张图像处理耗时控制在300ms以内。部署流程包括拉取预配置镜像、安装依赖库、下载模型权重及实现基于FastAPI的微服务接口,完成从质量检测到标准化输出的全流程处理
2026-01-14 15:20:22
765
原创 基于Python实现身份证版面信息高精度识读
本文提出一种基于Python的轻量级身份证识别方案,采用PaddleOCR(v5)深度学习模型,可在无GPU的服务器上3秒内完成识别。方案包含文本方向分类、检测和识别三个阶段,通过正则表达式和几何坐标对OCR结果进行结构化解析,精准提取姓名、性别等关键信息。测试表明,该系统能有效处理旋转、倾斜等干扰,准确率较高。安装时需注意PaddleOCR的版本兼容性,模型文件默认缓存于用户目录下。该方案适用于金融开户、政务办理等需要快速身份证识别的场景。
2026-01-12 20:20:42
1184
原创 基于OpenCV wechat_qrcode的多级增强二维码识别方案
本文提出了一种基于微信团队与OpenCV联合开发的wechat_qrcode模块的二维码识别增强方案。针对传统算法在反色、低对比度等复杂场景下识别率低的问题,设计了三层级联检测机制:首先尝试原始图像检测,失败后依次进行反色处理和CLAHE对比度增强。该方案通过CNN模型与预处理策略的结合,显著提升了二维码在恶劣条件下的识别率。文章详细介绍了模型部署、环境配置及多级处理流程的Python实现,为服务端高精度二维码识别提供了完整解决方案。
2026-01-12 09:05:28
604
原创 项目实践15—全球证件智能识别系统(切换为Qwen3-VL-8B-Instruct图文多模态大模型)
摘要: 本项目针对全球证件智能识别系统的后端推理引擎进行升级优化,将原Qwen3-VL-8B-Thinking模型替换为Qwen3-VL-8B-Instruct版本,显著提升OCR处理速度3倍以上。同时修正国外证件识别业务逻辑,移除不严谨的真伪判定提示,仅保留模板匹配与版面识别功能。升级涉及模型下载部署、容器配置更新及API代码调整,客户端无需修改。通过技术优化与业务逻辑重构,实现了响应效率提升与结果客观性的双重改进。
2026-01-09 12:17:53
1158
原创 项目实践14—全球证件智能识别系统(切换回SQLite数据库并基于Docker实现离线部署和日常管理)
全球证件智能识别系统离线部署方案采用Docker容器技术,将FastAPI后端服务、Python环境、系统依赖库和PostgreSQL数据库打包为单体容器镜像。通过Docker构建、导出、传输和导入流程实现离线交付,简化内网部署。方案包含详细的环境初始化、数据库配置和项目部署步骤,并开发了运维管理工具集,支持未知证件快速检索、数据批量导出和特征模型更新等功能。最终生成单一.tar镜像文件,实现"一次构建,随处运行"的部署目标。
2026-01-06 10:35:11
1073
原创 项目实践13—全球证件智能识别系统(内网离线部署大模型并调用)
本文详细介绍了在完全断网的内网GPU服务器上部署Qwen3-VL-8B-Thinking多模态大模型的完整流程。服务器配置为4张NVIDIA Tesla T4显卡(64GB总显存),采用全容器化方案确保数据安全。主要内容包括:1)Ubuntu Server 24.04 LTS系统的离线安装与初始化;2)关键步骤如磁盘格式化、用户创建和SSH配置;3)非系统盘数据清理方法;4)基础离线依赖包的准备与安装。特别强调了在断网环境下通过移动存储介质传输安装包的技术要点,为政务、金融等高敏感场景提供安全可靠的大模型部
2025-12-22 16:01:33
1127
原创 Ubuntu更改文件夹及子文件夹权限(拷贝、移动、删除)
摘要:本文介绍了一个快速修改文件权限的Linux命令。通过执行sudo chmod 777 * -R命令,可以递归地将当前目录下所有文件的权限设置为可读、可写、可执行(777权限)。该命令使用sudo获取管理员权限,-R参数实现递归操作,星号(*)表示作用于所有文件。但需注意这种宽松的权限设置可能存在安全隐患。
2025-12-20 18:29:27
142
原创 基于Windows Docker Desktop提取Ubuntu 24.04 Nvidia驱动编译所需的依赖包(gcc、build-essential、make等)
本文介绍了一种在物理隔离环境中高效部署依赖软件的标准化解决方案。针对Ubuntu Server 24.04系统,通过Docker Desktop容器技术模拟目标环境,利用apt包管理器自动解析并下载所有依赖项。关键步骤包括:创建本地存储目录、拉取匹配的基础镜像、启动容器并挂载工作区、使用apt-get download-only命令下载编译工具链和指定版本内核头文件。最后将下载的.deb文件拷贝至离线服务器,通过dpkg命令批量安装。该方法有效解决了传统手动下载方式效率低下和依赖遗漏问题,为高安全等级IT环
2025-12-19 23:15:13
960
原创 项目实践12—全球证件智能识别系统(建立样证上传通道)
本文介绍了"全球证件智能识别系统"中新增的"样证上传与反馈"功能开发。该功能通过建立人工反馈机制,使系统能够持续优化识别能力。后端采用PostgreSQL存储多光谱图像和业务元数据,基于FastAPI开发数据接收接口;客户端通过Qt对话框实现用户交互,包含动态表单验证和国别选择联动。系统设计强调数据溯源,预留设备序列号字段,为后续权限管理提供基础。这一功能实现了业务数据的闭环回流,为系统持续进化奠定基础。
2025-12-17 10:27:24
865
原创 项目实践11—全球证件智能识别系统(切换为PostgreSQL数据库)
本文介绍了将全球证件智能识别系统数据库从SQLite迁移到PostgreSQL的过程。PostgreSQL在生产环境中具有高并发支持、丰富数据类型和强大生态等优势。具体步骤包括:在Ubuntu上安装PostgreSQL服务并配置用户数据库;安装适配FastAPI的psycopg2驱动;修改database.py和Alembic配置文件以支持环境变量动态切换;深度改造数据模型,使用PostgreSQL原生ARRAY类型存储图像特征向量,替代原有的pickle序列化方式,提高数据处理效率和透明度。这些优化为系统
2025-12-16 16:53:07
646
原创 基于树莓派4与RaspAP搭建一台无线路由器
本文详细介绍了利用树莓派4和RaspAP定制镜像快速搭建无线AP的方法。针对国内网络环境下手动安装依赖困难的问题,推荐使用预集成的Custom OS镜像,通过Raspberry Pi Imager烧录后即可使用。文章包含硬件准备、镜像获取处理、烧录步骤、首次启动配置等完整流程,并提供了默认WiFi和管理后台的连接信息。该方案可快速将闲置树莓派转变为功能完备的无线路由器,支持Web界面管理、VPN配置等高级功能,是稳定高效的部署方案。
2025-12-07 15:40:15
827
原创 从零开始发表SCI论文—第1篇:安装Latex写作工具
摘要:本文详细介绍了Windows系统下LaTeX环境的搭建与Springer期刊模板的使用方法。首先推荐安装TeX Live发行版,建议下载ISO镜像文件进行完整安装,并确保路径不含中文字符。其次配置VS Code编辑器,安装LaTeX Workshop插件并设置自动化编译流程。最后以Springer Nature期刊模板为例,解析目录结构、修改文档类选项、调整参考文献格式,并演示编译过程。整套方案可实现保存即编译、交叉引用自动处理等功能,适用于学术论文写作与期刊投稿。
2025-11-30 23:01:14
853
原创 项目实践10—全球证件智能识别系统(逻辑和界面优化)
本文针对全球证件智能识别系统的交互逻辑和界面布局进行了优化改进。在交互方面,通过严格的状态管理策略,确保操作按钮仅在满足前置条件时激活,防止误操作导致的程序崩溃。具体实现包括:1)初始化禁用依赖数据的按钮;2)根据数据完整性动态更新按钮状态;3)在采集流程关键节点植入状态检查。 在界面布局方面,解决了QSplitter比例失调问题,通过设置尺寸策略和伸缩因子,强制保持左右区域4:1的固定比例,确保图像展示和识别结果区域的稳定性。这些优化显著提升了系统的健壮性和用户体验。
2025-11-27 13:48:51
973
原创 在Ubuntu系统中使用Nginx和花生壳部署并发布网站
本文详细介绍了在Ubuntu系统上使用Nginx部署静态网站并实现外网访问的完整流程。首先通过apt安装Nginx并配置防火墙,然后上传网站文件到/var/www/目录并设置权限。接着创建Nginx配置文件,设置服务器块、根目录和访问规则。最后利用花生壳内网穿透服务,通过端口映射将内网80端口映射到公网域名,实现外网访问。整个过程包含Nginx的安装配置、静态网站部署和花生壳设置等关键步骤,提供了一套完整的静态网站发布解决方案。
2025-11-10 17:11:45
1039
原创 项目实践8—全球证件智能识别系统(样证库整理与检索算法微调训练)
本文针对现有国外证件识别系统中MobileNetV3特征提取模型在小样本场景下性能不足的问题,提出了基于度量学习的改进方案。首先分析了当前系统架构的局限性,指出通用预训练模型对证件细粒度特征捕捉不足的缺陷。进而提出采用孪生网络和三元组损失的度量学习方法,通过优化特征空间分布来提升模型区分能力。为支持该方案,详细设计了样证库命名规范的优化策略,引入语义化可扩展的命名格式,并提供了自动化迁移脚本实现文件名重构与关联JSON文件的同步更新。这一改进为后续模型微调奠定了数据基础,旨在显著提升证件匹配的准确性。
2025-11-07 16:26:46
1153
原创 项目实践7—全球证件智能识别系统(国内证照调用大模型进行OCR)
本文介绍了"证照智能识别系统"后端服务的关键功能升级,重点在原有紫外防伪检测基础上新增了基于多模态大模型的深度OCR功能。针对国内驾驶证/行驶证等全息防伪证件,创新性地采用白光+红外图像的复合输入策略,通过大模型的辩证识别能力实现高精度结构化信息提取。技术方案包含:1)更新防伪检测模块返回机器可读证件类型;2)设计专用提示词实现结构化OCR输出;3)根据用户选项条件触发深度OCR流程。系统在真伪鉴别基础上新增信息提取能力,形成更完善的证照处理矩阵。
2025-11-04 11:41:38
865
原创 项目实践6—全球证件智能识别系统(防伪特征识别)
摘要 本文介绍了在"证照智能识别系统"后端服务中新增基于紫外荧光图像的国内证件防伪特征识别功能。采用预训练的YOLOv11m目标检测模型,通过ultralytics库实现高效部署。主要包含: 开发紫外防伪验证模块(UVValidator类),封装模型加载、图像处理、特征检测等核心逻辑 制定多级业务规则进行真伪判别,包括证件版心识别、纤维特征分析等关键指标 对检测结果进行可视化处理,标注发现的所有防伪特征 与现有识别体系无缝集成,形成国内外证件分类处理的能力分层 系统通过该功能可自动回答&
2025-10-29 16:08:12
1212
原创 项目实践5—全球证件智能识别系统(优化前后端逻辑)
本文介绍了"证照智能识别系统"的两项关键功能升级。首先,在客户端界面新增了"启用版面识别"复选框,让用户自主选择是否调用耗时的大模型深度识别功能。通过修改Qt界面代码和网络请求逻辑,将用户选择状态传递给后端。其次,后端服务更新了Pydantic数据模型和API端点,实现根据客户端指令条件化执行大模型推理的能力。系统现在可在快速检索和深度识别模式间灵活切换,同时确保数据隐私和用户体验。
2025-10-27 14:52:49
923
原创 项目实践9—全球证件智能识别系统(通义千问Qwen3-VL-8B-Thinking图文多模态大模型本地部署)
本文介绍了在本地部署阿里巴巴Qwen团队研发的多模态大模型Qwen3-VL-8B-Thinking的完整流程。该模型具备强大的视觉语言理解能力,支持图像、视频、OCR等多模态处理。文章详细阐述了本地化部署的优势(数据安全、成本可控、低延迟响应)、GPU资源规划方法,并重点推荐使用vLLM框架进行部署,因其具备高吞吐量、高效内存管理等特性。安装指南部分提供了NVIDIA驱动、CUDA Toolkit 12.8和cuDNN的详细安装步骤,确保环境配置正确。通过4张TITAN RTX GPU(96GB显存)的硬件
2025-10-27 14:21:24
3111
原创 项目实践4—全球证件智能识别系统(调用图文多模态大模型API进行版面翻译)
本文介绍"证照智能识别系统"后端服务的重大升级,重点集成图文多模态大模型以实现深度识别与翻译功能。系统在前端开发完成后,将引入Qwen3-VL-8B大模型解决传统OCR在全球证件识别中的版式多样性、多语言支持等难题。升级方案包括:通过FastAPI新增图像处理模块,支持证件图像拼接和大模型API调用;将传统"模板匹配"升级为"内容级深度解析",实现多语言OCR识别、翻译和结构化输出。大模型的零样本识别、语义理解等优势显著提升了系统在复杂场景下的处理
2025-10-22 16:15:03
1166
原创 项目实践3—全球证件智能识别系统(FastAPI后端数据库建模和图像检索)
本文介绍了"证照快速检索系统"的后端开发方案。系统采用FastAPI框架构建,使用SQLModel进行数据库操作,通过预训练MobileNet模型提取图像特征向量。核心功能是比对上传证件与标准模板的相似度,采用余弦相似度计算匹配度。数据库设计包含国家模型和证件模板模型,使用Alembic进行迁移管理。系统通过限定国家范围、白光图像比对等策略提高检索效率,当相似度超过阈值时返回匹配模板。整套方案实现了证照智能化识别与检索功能。
2025-10-22 14:41:01
855
原创 项目实践2—全球证件智能识别系统(Qt客户端与FastAPI后端交互)
本文介绍了全球证件智能识别系统Qt客户端开发中"国家代码"模块的实现。该模块通过集成ISO 3166-1标准的国家代码数据,设计为可编辑下拉列表(QComboBox)并配合QCompleter实现模糊匹配功能。文章详细阐述了三个关键步骤:1)功能设计思路,说明国家代码预选能提升后端识别效率;2)数据封装,创建CountryData类独立管理国家代码数据;3)界面集成,在主工具栏添加控件并实现动态匹配功能。该模块通过解耦数据和界面,优化了用户交互体验,为后续图像上传与识别奠定了基础。
2025-10-21 11:46:12
1180
原创 项目实践1—全球证件智能识别系统(Qt客户端开发)
本文介绍了一款智能证件识别系统的开发过程。该系统针对全球化背景下跨国证件识别难题,通过多光谱图像采集设备(自然光/红外光/紫外光)获取高质量图像,结合Qt客户端和FastAPI后端构建完整解决方案。开发环境配置包括Windows 10下的Qt 5.15.2客户端开发(兼容Win7及以上)和Ubuntu 22.04下的FastAPI后端服务。重点详述了Qt客户端的开发步骤:创建应用程序框架、设置窗体属性(标题/大小/高DPI支持)、添加程序图标等基础功能模块,为后续证件图像采集和处理功能奠定基础。该系统旨在实
2025-10-16 06:54:44
914
原创 企业级实战:构建基于Qt、C++与YOLOv8的模块化工业视觉检测系统(基于QML)
本文提出了一套基于Qt Quick(QML)和C++的工业视觉异常检测解决方案。系统采用前后端分离架构,前端使用QML构建交互界面,后端通过C++动态链接库封装核心AI算法。方案采用YOLOv8模型进行目标检测,通过OpenCV DNN模块实现CPU端推理,支持冲压件关键特征的自动化检测。系统具备图像加载、交互式ROI定义、智能检测和结果可视化功能,可有效提升工业质检的效率和精度。技术选型包括Qt 5.15.2、OpenCV 4.12.0等成熟框架,确保系统稳定性和跨平台兼容性。
2025-09-18 11:44:24
1380
原创 企业级实战:构建基于Qt、C++与YOLOv8的模块化工业视觉检测系统(基于QWidget)
在追求高效与精密的现代制造业中,自动化光学检测(AOI)已成为保障产品质量的核心技术。传统的质检流程往往受限于人工效率与主观判断,难以满足大规模、高精度的生产需求。本文旨在研发一套完整的、企业级的工业视觉异常检测解决方案,通过构建一个功能强大的桌面应用程序,实现对金属冲压件关键特征的自动化、高精度检测。该项目将采用模块化的软件工程思想,将核心的AI算法逻辑与前端用户界面彻底分离。算法部分将封装为一个独立的C++动态链接库(DLL),而用户交互界面则使用Qt 5.15.2的Widget框架进行开发。
2025-09-15 22:45:02
1270
1
原创 基于AI的科研图像生成方法探究:以Nano Banana为例
本文介绍了使用Nano Banana生成机器视觉学术配图的方法。通过输入包含机器视觉系统组成、核心特点、应用场景等详细文献信息,结合参考图的配色与风格,DeepSeek V3生成了专业英文提示词。该提示词要求绘制工业检测系统的示意图,包含硬件组件(光源、相机等)、数据处理流程(图像采集到缺陷检测)和结果分析三部分,采用蓝绿色系简约风格,突出系统协同工作原理。这种AI辅助绘图方法为科研配图提供了新思路,特别适合需要快速生成复杂系统示意图的场景。最终生成的图表符合学术发表要求,能清晰展示机器视觉"高效
2025-09-08 07:45:32
515
原创 一文掌握工业缺陷检测项目实战(Pytorch算法训练、部署、C++ DLL制作、Qt集成)
摘要:工业AI视觉检测标准化实践 本文提出一套端到端的工业AI视觉检测标准化工作流,涵盖从数据标注到模型部署全流程。核心内容包括:1)基于LabelMe工具构建标准COCO数据集;2)选用torchvision内置的Faster R-CNN模型,兼顾精度与易用性;3)采用ONNX Runtime实现跨平台高性能部署;4)通过C++动态链接库封装实现算法与应用分离。文章详细解析了Faster R-CNN两阶段检测原理,并提供了PCB缺陷检测的完整实现方案,包括环境配置、数据准备和标注指南。该方案为工业瑕疵检测
2025-09-06 19:16:37
3109
9
原创 从零打造一款专业级多光谱文档扫描与识别软件(基于 Qt 5.14 + OpenCV + FastAPI)
摘要: 本文介绍了一款基于Qt 5.14的多光谱文档扫描与识别软件开发过程。该软件旨在通过现代化界面和高效的多光谱采集设备,快速验证各类证件和文档的真伪。开发采用Qt Quick框架,集成OpenCV 4.11.0进行图像处理,并支持MSVC 2017 64位编译器。文章详细展示了从项目创建、环境配置到工程文件修改的全流程,包括Qt模块选择、OpenCV库链接及硬件通信库的集成。项目采用模块化设计,后续将逐步实现图像采集、OCR识别等功能,为开发者提供完整的实战参考。
2025-08-25 12:35:34
1225
原创 Python调用硅基流动大语言模型
本文介绍了如何使用SiliconFlow API调用语言模型和图文多模态模型。首先需安装openai和pillow库。语言模型调用示例展示了如何通过DeepSeek-V3模型获取关于中国大模型行业2025年发展的分析。图文模型部分详细说明了如何将本地图片转换为WebP格式的Base64字符串,并通过GLM-4.5V模型进行OCR识别。两个示例均采用流式响应处理,支持实时输出结果。文中的代码片段可直接用于实际开发,只需替换API密钥和图片路径即可。
2025-08-24 16:30:44
1024
原创 AI质检数据准备利器:基于Qt/QML 5.14的图像批量裁剪工具开发实战
本文介绍了一个基于Qt和QML开发的工业质检数据预处理工具,旨在解决AI计算机视觉项目中手动裁剪训练样本的低效问题。该工具采用前后端分离架构:C++后端负责图像加载、坐标转换和裁剪保存逻辑,QML前端实现用户交互界面。核心功能包括:1)加载高分辨率工业图像;2)通过鼠标拖拽框选目标区域;3)一键裁剪并自动保存为序列编号的JPG文件;4)自动创建输出目录并提供操作反馈。该工具可显著提升AI质检项目的数据准备效率,避免传统人工裁剪方式的重复劳动和错误风险。
2025-08-10 20:11:42
907
原创 基于Qt/QML 5.14和YOLOv8的工业异常检测Demo:冲压点智能识别
本文介绍了一个基于Qt和OpenCV的工业质检自动化Demo项目,通过YOLOv8模型实现金属件冲压点的智能检测。项目采用Qt 5.14 QML构建现代化UI界面,支持用户框选产品区域并自动识别两个关键冲压点。技术架构采用前后端分离设计:前端QML负责图像显示和交互,后端C++处理图像裁剪、ONNX模型推理等核心功能。项目重点解决了大尺寸图像处理、坐标转换、模型推理等关键技术问题,并考虑工业环境下的兼容性需求(支持Windows 7 64位系统)。该方案验证了AI技术在提升质检效率和准确性方面的潜力,为工业
2025-08-10 13:51:42
1215
原创 解决docker load加载tar镜像报json no such file or directory的错误
摘要:解决Docker加载离线镜像时出现"json no such file"错误的方法是将镜像文件重新打包。具体步骤为:先用tar -xvf解压原.tar文件,删除原文件后,再用tar -cvf重新压缩当前目录所有文件。该方法有效但原因不明,推测可能是跨设备拷贝时压缩方式不一致导致的。这种重新打包的方式能确保文件结构正确,从而解决加载问题。(149字)
2025-08-05 16:36:26
8620
原创 《使用Qt Quick从零构建AI螺丝瑕疵检测系统》——9. 接入真实硬件:驱动USB摄像头
本文介绍了将静态图像检测升级为动态视频流检测的关键技术方案。主要内容包括:1)使用Qt Multimedia模块实现USB摄像头驱动,捕获实时视频帧;2)设计多线程架构,将摄像头采集和AI推理任务放在独立工作线程,避免阻塞UI线程;3)通过QVideoFrame到cv::Mat的转换实现视频帧处理;4)构建CameraWorker类实现后台处理逻辑,通过信号槽机制与主线程通信。该方案适用于工业流水线等实时检测场景,在保证界面流畅性的同时完成动态视频分析任务。
2025-08-03 20:56:33
1138
简单实用的基于python的中文OCR字符识别
2018-09-29
深度学习python安装包
2018-09-13
一款好看的展示列表(基于Bootstrap)
2019-03-22
富文本使用案例
2019-03-12
结合Django和Bootstrap开发搜索框功能(详细教程,内含源代码,Windows平台开发)
2019-03-05
根据原图和对应的alpha图提取前景并且合成新图(基于python+opencv)
2019-02-26
Windows下BPG图像官方压缩和解压缩工具
2018-09-26
完整的MFC程序打包方案(基于advanced installer)(附教程)
2019-04-03
django通过ajax实现的在线计算器程序(界面精美)
2018-12-13
testpro.rar
2020-08-14
django操作word实现文字和图片的替换
2018-08-23
老照片修复方向论文《Contextual-Assisted Scratched Photo Restoration》
2024-11-29
PaddleLite2.12版本对应的C++库,用于开发Windows32位程序
2024-05-18
利用Python的OpenCV和Pillow实现图片加水印(效果精美)
2024-01-06
面向Windows在C++中调用Pytorch模型(MNIST手写体数字识别)
2019-11-01
vote12345.rar
2019-05-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅