winxp-pic-CSDN博客

原创二维码微观特征识别技术

摘要：本项目基于特征提取和二维码定位技术，实现相同码值二维码标签的唯一识别与真伪校验。核心方案是通过工业相机采集标签微观印刷缺陷特征建立数据库，手机端拍摄后提取特征进行相似度比对（0.5-1.0为真，0.0-0.49为假）。技术优势在于：1）精准提取微观缺陷特征区分同码不同标签；2）自适应参数处理不同分辨率图像；3）批量处理满足高效需求。项目适用于工业溯源、防伪校验等场景，解决了同码标签无法区分的行业痛点，兼顾工业级精度与移动端便捷性。

2026-04-25 15:11:04 329

原创视频监控平台

WEBVIDEOPLATFORM是一个基于GB28181-2016、部标808/1078标准的视频管理平台，支持海康、大华等品牌设备接入，具备国标级联功能。平台集成ZLMediaKit流媒体框架和jessibuca/h265web.js播放器，提供网页无插件播放、云台控制、录像回放等功能。支持多协议转换、集群部署、跨平台运行，并具备电子地图、报警管理等高级特性。采用MIT开源协议，同时提供付费技术支持服务。平台支持5万+设备并发接入，适用于安防监控、视频联网等场景。

2026-04-22 13:42:08 230

原创图片校正软件操作说明及算法介绍

摘要：本文介绍了一款基于OpenCV和深度学习的双区域图片校正工具。该软件能自动定位图片左右区域各4个特征点，通过透视变换将倾斜区域校正为规则矩形，并自动拼接保存结果。支持Ubuntu/Windows系统，提供深度学习自动定位和手动调整两种模式，配套轻量化MobileNet模型确保定位精度。核心算法包含特征点检测和四点透视校正两部分，具有处理速度快（1-2秒/图）、精度高、操作简便等特点，适用于文档扫描等图像预处理场景。软件自动生成校正图、拼接图和特征点坐标记录，支持模型复用和结果验证。

2026-04-16 23:15:41 389 1

原创 yolo训练平台

这篇文章介绍了一个基于Gradio构建的YOLO11目标检测模型训练可视化工具。该工具通过图形化界面简化了模型训练流程，无需编写命令行指令即可完成配置与执行。系统核心功能包括：1）支持选择不同大小的YOLO11模型(n/s/m/l/x)；2）提供完整的训练参数配置界面；3）实时展示训练日志和结果曲线；4）自动处理训练过程中的文件路径和系统验证。工具采用左侧参数配置、右侧结果展示的布局，支持自定义训练轮数、图像尺寸、批次大小等参数，并能自动生成训练曲线和性能指标。使用前需要安装Gradio和Ultralyti

2026-04-12 23:50:43 298

原创喷洒农药检测算法演示

摘要：本文介绍了一种基于图像处理的农药喷洒质量检测算法。该系统通过暗通道先识和透射率分析，可实时评估喷洒均匀度、雾滴密度及雾化效果，自动识别漏喷、重喷等问题区域，并量化雾滴覆盖率。该方案支持无人机/植保机作业场景，无需人工巡检，单张图像即可完成检测，有助于提高农药利用率，减少浪费，推动智慧农业发展。核心功能包括雾化质量判定、喷洒均匀度检测和覆盖密度量化三大模块。

2026-04-10 17:05:31 31

原创跌倒检测演示

摘要：本文提出基于视觉大模型的跌倒检测算法，通过人体姿态估计实时分析运动轨迹和空间位置，精准识别跌倒行为。该算法利用大模型的强大特征提取能力，自适应复杂场景和遮挡情况，有效区分正常活动与真实跌倒。支持单帧和时序分析，实现毫秒级预警，适用于养老院、医院等多种安防场景，提供智能化非接触防护。

2026-04-10 17:03:52 34

原创一键批量转换：视频转JPG帧工具

摘要：视频批量转帧工具（V1.0）是一款适用于Windows系统的轻量级绿色软件（80MB），支持将AVI/MP4视频批量转换为JPG图片帧。核心功能包括自定义帧间隔（如每10帧提取1张）、图片缩小（0.25倍分辨率）、自动创建同名文件夹分类保存。软件无需安装Python等依赖，提供图形化界面，操作简单四步完成：选择文件夹→设置参数→开始转换→查看结果。支持多视频并行处理，实时日志显示进度，适合短视频创作者、办公人员等用户。常见问题涵盖启动失败、文件路径规范及画质调整方案，后续将扩展更多格式支持。软件完全

2026-04-08 10:19:27 391

原创实时眨眼检测：使用C++实现驾驶员疲劳检测

我们对基于 Transformer 架构的实验显示出在极端条件下提高性能的潜力，不过当前的实现将实时处理和实际部署的考量放在首位。我们的眨眼检测系统的基础，在于对计算机视觉的核心原理的理解。在这个过程当中，OpenCV 是我们极为强大的助手，它提供了高度优化的算法，从而使得实时处理得以成为可能。通过跟踪诸如 PERCLOS（眼睛闭合百分比）和眨眼频率之类的指标，我们可以以 92% 的准确率检测出疲劳的早期迹象。• 我们的实现可在正常光照条件下达到 98% 的人脸检测准确率，且每帧的处理时间仅为 5 毫秒。

2025-01-23 18:14:18 1085

原创基于机器视觉的钢管表面缺陷检测方法

目前，钢管的表面缺陷的检测大多通过人工方式实现，人工方式依赖于现场经验且效率低，受现场环境的影响，劳动强度大，易产生漏检和误检现象，不能全面反应钢管表面的质量，检测实时性差，检测种类少，检测效率低，缺乏对产品的表面质量的综合评估。当图像获取不理想时，会增加图像处理的难度。根据图像饱和度、像素分布、目标图像边沿、亮度等信息转换成计算机识别的数字信号，利用先进的算法对图像进行特征识别，将特征识别出来的结果进行评价，输出最终的缺陷结果，包括缺陷、尺寸、角度、个数、合格与不合格、有无等，实现自动识别功能。

2025-01-23 17:57:04 1163

原创 “腾讯、钉钉、飞书” 会议开源平替，免费功能强大

Jitsi Meet是由8x8团队和社区共同开发的一个开源项目，它提供了一套完整的视频会议解决方案。无论你是个人用户、开发者，还是企业，都可以轻松使用或部署Jitsi Meet。它支持高清的音视频质量，还有丰富的互动功能，让你在视频会议中如鱼得水！目前在Github上收获了24.1K star！

2025-01-23 16:49:45 4647

原创视频行为分析系统，可做安全行为检测，比如周界入侵，打架

基于视频行为分析系统v4系列版本可以在不用考虑流媒体音视频开发，编解码开发，界面开发等情况下，只需要训练自己的模型，开发自己的行为算法插件，就可以轻松开发出任何你想要的安全行为检测，比如周界入侵，打架，斗殴，跌倒，人群聚集，离岗睡岗，安全帽检测，充电桩，工作服，疲劳检测，交通拥堵等等。从v4.24版本开始，该软件已经支持Windows10，Windows11，Ubuntu20，Ubuntu21，Ubuntu22，Ubuntu23。注：当前仅提供Windows版编译安装包，其他平台编译请联系作者。

2025-01-22 18:32:32 1155

原创机器人操作系统！下一个安卓横空出世？

虽然谷歌并未直接开发Robot Platform，但Robot Platform作为一个独立的开源机器人框架，在机器人和人工智能领域发挥着重要作用，获得了谷歌的资金支持。它提供了丰富的功能和工具，简化了机器人应用程序的开发过程，促进了机器人技术的发展和应用。对于对机器人开发感兴趣的开发者来说，Robot Platform是一个值得关注和使用的平台。Robot Platform旨在简化机器人应用程序的开发过程，通过提供预构建的模块，使开发者能够更快地实现复杂的机器人功能。项目背后是谷歌支持，谷歌深谋远虑！

2025-01-22 10:49:15 550 1

原创一个面向领域的直播平台开源！

这个基于Spring Boot和SRS的在线直播平台具有丰富的功能和良好的扩展性。通过二开和扩展，可以进一步满足教育等领域的需求，为用户提供更加便捷、高效的在线直播和互动体验。如果您有具体的开发需求或问题，欢迎随时提问。面向教育等领域，二开后可以做视频会议等。

2025-01-21 18:29:51 1132

原创在线医院系统

虽然这个开源项目的链接，但强烈建议不要在没有合法医疗资质和合规性保障的情况下自行搭建和运营这样的系统。在线医院系统是一个基于Spring Cloud构架的在线医疗系统，并且提供了源代码的链接，这是一个非常有价值的技术资源对于开发者来说。这是一个非常重要的提醒，因为医疗系统的搭建和运营涉及到法律法规、医疗资质、患者隐私保护等多个方面。医生可以通过该模块查看和管理自己的病人列表，包括病人的基本信息、病历记录等。用于管理患者的出院流程，包括出院指令的下达、出院证明的生成等。

2025-01-21 13:38:37 392

原创自动化标注平台开源，基于 yolov8标注平台可本地部署

一款开源的数据标注工具，具有以下特点：支持多种数据类型：支持文本、图像、音频、视频等多种数据类型的标注，适用于自然语言处理、图像识别、语音识别等多种应用场景。灵活易用：用户可以根据项目需求自定义标注界面和标注任务，调整标注工具的外观和功能。同时，提供交互式的标注体验，用户可以在浏览器中方便地进行标注工作，并实时查看标注效果。强大的集成与扩展性：可以与其他工具和平台集成，如机器学习框架、数据库、云存储等。同时，它还支持插件和脚本扩展功能，以满足更复杂的标注需求。

2025-01-21 13:35:22 1952 1

原创数字孪生工厂监控预警平台

随着物联网、云计算、大数据等技术的飞速发展，智慧工厂建设已成为未来发展的重要方向。智慧工厂监控预警平台作为智慧工厂的核心组成部分，承担着对工厂环境、设施设备、公共安全等方面的全方位、多维度实时监测任务。然而，随着工厂规模的扩大和监控数据量的激增，如何高效管理和利用这些数据，提高监控预警的精度和及时性，成为了亟待解决的问题。

2025-01-21 09:57:44 1038

原创医学突破！医学影像大模型

医学影像大模型医学影像大模型是一个综合的混合大模型，它集成了深度学习、大数据分析等先进技术，通过对医学影像、医学数据等海量信息的分析，对现有医疗诊断产生了深远的影响。

2025-01-14 18:34:48 1660

原创实战threeJS数字孪生开源数字工厂

该项目结合了现代前端技术栈，包括Vue 3、Element Plus、Three.js和ECharts等，实现了路线巡逻、巡逻轨迹展示、第一人称视角、视角切换、着色器渲染、设备定位、区域检测以及进入区域告警提示等核心功能。它结合了现代前端技术栈，实现了路线巡逻、巡逻轨迹展示、第一人称视角、视角切换、着色器渲染、设备定位、区域检测以及进入区域告警提示等核心功能。：作为数据可视化库，ECharts 提供了丰富的图表类型，用于展示生产数据、设备状态等信息，帮助用户更好地理解和分析生产数据。

2025-01-14 18:33:02 2757

原创批量为视频生成字幕

这个开源项目为视频处理提供了全面的字幕生成和翻译解决方案，通过图形用户界面和丰富的功能，使得用户可以轻松地为视频添加字幕，并将其翻译成其他语言。无论是个人用户还是专业人士，都能从这个项目中受益。如果你在使用过程中遇到任何问题或有改进建议，欢迎通过提 Issue 的方式参与项目的改进和发展。

2025-01-14 18:31:12 782

原创基于当前最前沿的前端（Vue3 + Vite + Antdv）和后台（Spring boot）实现的低代码开发平台

项目名称：lowcode-seezoon，可以暂称其为“基于Vue3+Vite+Antdv+Spring Boot的低代码开发平台”。项目目标：以快速开发为目的，提供一套高效、灵活的低代码开发解决方案。技术栈前端后台。

2025-01-14 18:29:22 3283 1

原创从 2D 图像中学习 3D 人机交互关系

LEMON（LEarning 3D huMan-Object iNteraction relation）模型是一个统一的框架，它通过联合预测人类接触点、物体可供性和人-物空间关系这三个交互元素，来捕捉人类与物体在3D空间中的交互关系。LEMON模型的核心思路是利用交互中人和物体的语义与几何上的关联去建模这些交互表征。

2025-01-09 11:02:18 753

原创团队协同、中小企业系统开发框架

一、项目背景在当今信息化时代，企业对于高效、便捷、灵活的协同办公系统需求日益迫切。尤其是对于中小企业而言，传统的商业化协同办公系统往往价格昂贵且功能复杂，难以满足其快速迭代、灵活定制的需求。因此，一个基于开源协议、面向中小企业的团队协同办公系统框架应运而生。该项目旨在通过开源的方式，为中小企业提供一站式解决方案，涵盖企业OA协同、伙伴管理、用户管理、云文档、企业建站等多个方面，帮助企业降低运营成本，提高管理效率。二、产品功能企业OA协同。

2025-01-07 13:34:45 501

原创一款面向数字孪生的数据中台

该项目正是一个这样的数据中台，它结合了实时接口转发、数据库查询、数据拦截、数据落库、静态接口、缓存机制、多角色第三方token模式、文档聚合、限流熔断策略、权限支持ABAC模式、TLog日志追踪、数据融合等多种功能模块，为用户提供了全面、灵活的数据处理解决方案。总之，该项目是一个基于大屏类业务而产生的数据中台，它提供了全面、灵活的数据处理解决方案，并具有良好的市场前景和商业价值。此外，该项目还可以用于企业内部的数据中台建设，实现跨部门、跨系统的数据共享和整合，提高数据的利用率和价值。

2025-01-07 09:16:43 1466

原创 AI算法中台系统-让Java能够方便训练、部署、使用AI模型

随着人工智能技术的飞速发展，AI算法在各个行业的应用越来越广泛。然而，对于许多JAVA开发者来说，训练和部署AI模型仍然是一个挑战，因为传统的AI开发流程往往涉及多种语言和工具，如Python用于模型训练，C++用于高性能推理等。为了简化这一流程，gpp平台开源了一个基于SpringBoot+Docker+Cuda+Cudnn+ Pytorch+Onnx+Tensorrt+Yolov8+ffmpeg+zlmediakit的AI算法中台系统。

2025-01-06 11:16:37 1687

原创智慧仓储系统,

它不仅提高了仓储和物流的效率和准确性，还降低了企业的运营成本和风险，是现代企业提升竞争力的重要手段之一。智能监控：通过传感器和监控系统，实时监测仓库内的环境参数（如温度、湿度、空气质量等）和货物状态，保障货物的安全。预测性维护：物联网技术收集设备运行数据，进行预测性维护，提前发现潜在的故障风险，及时进行维修或更换，避免因设备故障导致的停机损失。基础数据管理：使商品、分类、颜色、尺码、品牌、材质、款式等信息的管理变得轻松高效，为企业的精细化管理提供了有力支持。

2024-12-27 09:40:23 811

原创通过AI进行高标准农田监管平台

智慧农业-高标准农田监管平台-遥感监测-AI识别。

2024-12-25 14:02:05 851

原创智慧农场数字大屏-农场数字化

数字孪生是指通过各种传感器，如温度、湿度传感器等集成物理反馈数据，并辅以人工智能、机器学习和软件分析，在信息化平台内创建一个数字化模拟，这个模拟会根据反馈做出相应的变化。

2024-12-23 18:39:51 1219

原创又一个很牛的数字人，可以让憨豆讲普通话

JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation》提出了一种基于扩散模型的音频驱动面部动画生成方法，通过解耦的面部表示框架和扩散变换器实现了面部动态和头部运动的生成。该方法不仅适用于人类肖像动画，还能够生成动物面部动画，具有广泛的应用前景。

2024-12-23 18:34:20 1481

原创基于医疗领域知识图谱的问答系统

知识图谱是一种半结构化数据的表示方法，它用于描述实体、属性和实体之间的关系。知识图谱的核心思想是将现实世界中的信息转化为图形，其中节点表示实体，边表示实体之间的关系。知识图谱不仅包含了对实体和关系的语义描述，还具备可被计算机理解和处理的能力。基于知识图谱的医疗问答系统旨在通过构建医疗领域的知识图谱，实现对医疗知识的语义理解和推理，从而为用户提供准确、详细的医疗问答服务。该系统结合了知识图谱、自然语言处理、数据库和机器学习等多个学科的知识。基于知识图谱的医疗问答系统是一种高效、准确的医疗人工智能应用。

2024-12-23 14:39:08 1402

原创基于深度学习的肿瘤辅助诊断系统

系统以图像分割为核心，利用人工智能完成肿瘤区域的识别勾画并提供肿瘤区域的特征来辅助医生进行诊断。有完整的模型构建、后端架设和前端访问功能。

2024-12-23 14:29:09 688

原创多角度文字识别：应对复杂环境的智能解决方案

多角度文字识别（Multi-Angle Text Recognition）是指在不同视角、不同光照条件和不同背景下对文本进行识别的技术。这项技术在许多应用场景中都非常重要，例如自动驾驶、智能监控、文档数字化等。

2024-08-09 11:54:05 605

原创该方法通过基于 cv2.VideoCapture 能够获取视频流入（rtmp/rtsp等）实时帧，能够解决由于图像处理速度不够等原因造成帧堆积的问题。

解决由于图像处理速度不够等原因造成帧堆积的问题

2024-06-25 11:25:34 893

原创手写轨迹识别数字

使用方法获取笔迹，笔迹字段为数组，每个对象有3个值，x：笔迹的x值，y：笔迹的y值，action：动作（包含3个动作，down落笔,up抬笔，move移动）使用自定义模板实现了手写识别，目前实现了纯数字的识别，后续正在开发英文数字的识别。

2023-06-03 14:46:40 451 1

原创提取图像的边缘信息

利用image moment提取图像的边缘信息，所有kernel在RTX 2060上时间6ms

2022-11-04 21:25:02 327

原创 yolov7人脸检测

yolov7人脸检测

2022-11-02 17:52:27 1008

原创图像自研SDK算子

图像算法算子U2FsdGVkX19R0laXM9Q0lTlTY7e775ooBeh1qQOvX8g=

2022-10-28 14:39:27 332

原创 Tensorfllow js 利用ssdlite mobilenetv2（含quantization)进行鞋检测

Tensorfllow js 利用ssdlite mobilenetv2（含quantization)进行鞋检测

2022-10-26 21:33:52 412

原创通过libusb库和opencv获取usb摄像头图像

通过libusb库和opencv获取usb摄像头图像

2022-10-26 21:23:22 2711

原创从连接到手机的 OAK-D 设备获取 rgb 和视差图像的 Android 示例

从连接到手机的 OAK-D 设备获取 rgb 和视差图像的 Android 示例

2022-10-26 19:08:18 755 1

原创从指定 URL 读取图像并以 OpenCV 格式返回的函数（从指定 URL 读取图像并使其可由 OpenCV 处理。）

从指定 URL 读取图像并以 OpenCV 格式返回的函数（从指定 URL 读取图像并使其可由 OpenCV 处理。）

2022-10-26 17:06:51 1315

批量将AVI、MP4格式视频转换为JPG图片帧，支持自定义帧间隔、图片缩小，自动为每个视频创建同名文件夹保存图片，操作简单、无技术门槛，适配普通用户与轻度办公、创作需求

视频批量转帧工具（AVI/MP4→JPG）使用介绍文档软件基础信息软件名称：视频批量转帧工具（AVI/MP4→JPG）软件版本：V1.0 适用系统：Windows 7/8/10/11（32位/64位）软件大小：约80MB（单文件EXE，无需额外依赖）核心功能：批量将AVI、MP4格式视频转换为JPG图片帧，支持自定义帧间隔、图片缩小，自动为每个视频创建同名文件夹保存图片，操作简单、无技术门槛，适配普通用户与轻度办公、创作需求。软件优势：1. 图形化界面（GUI），傻瓜式操作，无需输入命令；2. 支持批量处理，多视频同时转换，节省时间；3. 可自定义帧间隔，按需保存视频帧；4. 可选图片缩小功能（0.25倍），节省存储空间；5. 实时日志显示，转换进度清晰可见；6. 单文件EXE，双击直接运行，无需安装Python及任何依赖库。适用人群：短视频创作者、办公人员、学生、科研工作者等，需将视频帧提取为图片的各类用户。安装说明一、安装前提 1. 确保电脑系统为Windows 7及以上版本，无系统权限限制； 2. 电脑剩余存储空间≥100MB（用于存放软件本身及转换后的图片）； 3. 无需安装Python、OpenCV等任何依赖，软件已集成所有必要组件。二、安装步骤 1. 从官方下载渠道获取软件安装包（文件名：avi2jpg_gui.exe）； 2. 找到下载后的EXE文件，双击运行（无需管理员权限，若弹出安全提示，选择“允许运行”）； 3. 软件无需安装，双击后直接启动图形界面，启动成功即可开始使用（建议将软件发送到桌面快捷方式，方便后续打开）。三、卸载方法软件为绿色单文件版本，无需复杂卸载操作： 1. 关闭正在运行的软件； 2. 直接删除桌面快捷方式（若创建）； 3. 找到下载的avi2jpg_gui.exe文件，

2026-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

批量将AVI、MP4格式视频转换为JPG图片帧，支持自定义帧间隔、图片缩小，自动为每个视频创建同名文件夹保存图片，操作简单、无技术门槛，适配普通用户与轻度办公、创作需求

证件照和摄像头比对

一个支持多线程管道服务器

重叠IO的管道服务器程序

PCA-matlab实现人脸识别

空空如也