自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一个爱编程的人专栏

数字水印,数字图象,模式识别

  • 博客(230)
  • 资源 (4)
  • 收藏
  • 关注

原创 实时眨眼检测:使用C++实现驾驶员疲劳检测

我们对基于 Transformer 架构的实验显示出在极端条件下提高性能的潜力,不过当前的实现将实时处理和实际部署的考量放在首位。我们的眨眼检测系统的基础,在于对计算机视觉的核心原理的理解。在这个过程当中,OpenCV 是我们极为强大的助手,它提供了高度优化的算法,从而使得实时处理得以成为可能。通过跟踪诸如 PERCLOS(眼睛闭合百分比)和眨眼频率之类的指标,我们可以以 92% 的准确率检测出疲劳的早期迹象。• 我们的实现可在正常光照条件下达到 98% 的人脸检测准确率,且每帧的处理时间仅为 5 毫秒。

2025-01-23 18:14:18 852

原创 基于机器视觉的钢管表面缺陷检测方法

目前,钢管的表面缺陷的检测大多通过人工方式实现,人工方式依赖于现场经验且效率低,受现场环境的影响,劳动强度大,易产生漏检和误检现象,不能全面反应钢管表面的质量,检测实时性差,检测种类少,检测效率低,缺乏对产品的表面质量的综合评估。当图像获取不理想时,会增加图像处理的难度。根据图像饱和度、像素分布、目标图像边沿、亮度等信息转换成计算机识别的数字信号,利用先进的算法对图像进行特征识别,将特征识别出来的结果进行评价,输出最终的缺陷结果,包括缺陷、尺寸、角度、个数、合格与不合格、有无等,实现自动识别功能。

2025-01-23 17:57:04 835

原创 “腾讯、钉钉、飞书” 会议开源平替,免费功能强大

Jitsi Meet是由8x8团队和社区共同开发的一个开源项目,它提供了一套完整的视频会议解决方案。无论你是个人用户、开发者,还是企业,都可以轻松使用或部署Jitsi Meet。它支持高清的音视频质量,还有丰富的互动功能,让你在视频会议中如鱼得水!目前在Github上收获了24.1K star!

2025-01-23 16:49:45 1310

原创 视频行为分析系统,可做安全行为检测,比如周界入侵,打架

基于视频行为分析系统v4系列版本可以在不用考虑流媒体音视频开发,编解码开发,界面开发等情况下, 只需要训练自己的模型,开发自己的行为算法插件,就可以轻松开发出任何你想要的安全行为检测,比如周界入侵,打架,斗殴,跌倒,人群聚集,离岗睡岗,安全帽检测,充电桩,工作服, 疲劳检测,交通拥堵等等。从v4.24版本开始,该软件已经支持Windows10,Windows11,Ubuntu20,Ubuntu21,Ubuntu22,Ubuntu23。注:当前仅提供Windows版编译安装包,其他平台编译请联系作者。

2025-01-22 18:32:32 751

原创 机器人操作系统!下一个安卓横空出世?

虽然谷歌并未直接开发Robot Platform,但Robot Platform作为一个独立的开源机器人框架,在机器人和人工智能领域发挥着重要作用,获得了谷歌的资金支持。它提供了丰富的功能和工具,简化了机器人应用程序的开发过程,促进了机器人技术的发展和应用。对于对机器人开发感兴趣的开发者来说,Robot Platform是一个值得关注和使用的平台。Robot Platform旨在简化机器人应用程序的开发过程,通过提供预构建的模块,使开发者能够更快地实现复杂的机器人功能。项目背后是谷歌支持,谷歌深谋远虑!

2025-01-22 10:49:15 263

原创 一个面向领域的直播平台开源!

这个基于Spring Boot和SRS的在线直播平台具有丰富的功能和良好的扩展性。通过二开和扩展,可以进一步满足教育等领域的需求,为用户提供更加便捷、高效的在线直播和互动体验。如果您有具体的开发需求或问题,欢迎随时提问。面向教育等领域,二开后可以做视频会议等。

2025-01-21 18:29:51 712

原创 在线医院系统

虽然这个开源项目的链接,但强烈建议不要在没有合法医疗资质和合规性保障的情况下自行搭建和运营这样的系统。在线医院系统是一个基于Spring Cloud构架的在线医疗系统,并且提供了源代码的链接,这是一个非常有价值的技术资源对于开发者来说。这是一个非常重要的提醒,因为医疗系统的搭建和运营涉及到法律法规、医疗资质、患者隐私保护等多个方面。医生可以通过该模块查看和管理自己的病人列表,包括病人的基本信息、病历记录等。用于管理患者的出院流程,包括出院指令的下达、出院证明的生成等。

2025-01-21 13:38:37 256

原创 自动化标注平台开源,基于 yolov8标注平台可本地部署

一款开源的数据标注工具,具有以下特点:支持多种数据类型:支持文本、图像、音频、视频等多种数据类型的标注,适用于自然语言处理、图像识别、语音识别等多种应用场景。灵活易用:用户可以根据项目需求自定义标注界面和标注任务,调整标注工具的外观和功能。同时,提供交互式的标注体验,用户可以在浏览器中方便地进行标注工作,并实时查看标注效果。强大的集成与扩展性:可以与其他工具和平台集成,如机器学习框架、数据库、云存储等。同时,它还支持插件和脚本扩展功能,以满足更复杂的标注需求。

2025-01-21 13:35:22 1079

原创 数字孪生工厂监控预警平台

随着物联网、云计算、大数据等技术的飞速发展,智慧工厂建设已成为未来发展的重要方向。智慧工厂监控预警平台作为智慧工厂的核心组成部分,承担着对工厂环境、设施设备、公共安全等方面的全方位、多维度实时监测任务。然而,随着工厂规模的扩大和监控数据量的激增,如何高效管理和利用这些数据,提高监控预警的精度和及时性,成为了亟待解决的问题。

2025-01-21 09:57:44 825

原创 医学突破!医学影像大模型

医学影像大模型医学影像大模型是一个综合的混合大模型,它集成了深度学习、大数据分析等先进技术,通过对医学影像、医学数据等海量信息的分析,对现有医疗诊断产生了深远的影响。

2025-01-14 18:34:48 779

原创 实战threeJS数字孪生开源 数字工厂

该项目结合了现代前端技术栈,包括Vue 3、Element Plus、Three.js和ECharts等,实现了路线巡逻、巡逻轨迹展示、第一人称视角、视角切换、着色器渲染、设备定位、区域检测以及进入区域告警提示等核心功能。它结合了现代前端技术栈,实现了路线巡逻、巡逻轨迹展示、第一人称视角、视角切换、着色器渲染、设备定位、区域检测以及进入区域告警提示等核心功能。:作为数据可视化库,ECharts 提供了丰富的图表类型,用于展示生产数据、设备状态等信息,帮助用户更好地理解和分析生产数据。

2025-01-14 18:33:02 1113

原创 批量为视频生成字幕

这个开源项目为视频处理提供了全面的字幕生成和翻译解决方案,通过图形用户界面和丰富的功能,使得用户可以轻松地为视频添加字幕,并将其翻译成其他语言。无论是个人用户还是专业人士,都能从这个项目中受益。如果你在使用过程中遇到任何问题或有改进建议,欢迎通过提 Issue 的方式参与项目的改进和发展。

2025-01-14 18:31:12 549

原创 基于当前最前沿的前端(Vue3 + Vite + Antdv)和后台(Spring boot)实现的低代码开发平台

项目名称:lowcode-seezoon,可以暂称其为“基于Vue3+Vite+Antdv+Spring Boot的低代码开发平台”。项目目标:以快速开发为目的,提供一套高效、灵活的低代码开发解决方案。技术栈前端后台。

2025-01-14 18:29:22 2712 1

原创 从 2D 图像中学习 3D 人机交互关系

LEMON(LEarning 3D huMan-Object iNteraction relation)模型是一个统一的框架,它通过联合预测人类接触点、物体可供性和人-物空间关系这三个交互元素,来捕捉人类与物体在3D空间中的交互关系。LEMON模型的核心思路是利用交互中人和物体的语义与几何上的关联去建模这些交互表征。

2025-01-09 11:02:18 593

原创 团队协同、中小企业系统开发框架

一、项目背景在当今信息化时代,企业对于高效、便捷、灵活的协同办公系统需求日益迫切。尤其是对于中小企业而言,传统的商业化协同办公系统往往价格昂贵且功能复杂,难以满足其快速迭代、灵活定制的需求。因此,一个基于开源协议、面向中小企业的团队协同办公系统框架应运而生。该项目旨在通过开源的方式,为中小企业提供一站式解决方案,涵盖企业OA协同、伙伴管理、用户管理、云文档、企业建站等多个方面,帮助企业降低运营成本,提高管理效率。二、产品功能企业OA协同。

2025-01-07 13:34:45 387

原创 一款面向数字孪生的数据中台

该项目正是一个这样的数据中台,它结合了实时接口转发、数据库查询、数据拦截、数据落库、静态接口、缓存机制、多角色第三方token模式、文档聚合、限流熔断策略、权限支持ABAC模式、TLog日志追踪、数据融合等多种功能模块,为用户提供了全面、灵活的数据处理解决方案。总之,该项目是一个基于大屏类业务而产生的数据中台,它提供了全面、灵活的数据处理解决方案,并具有良好的市场前景和商业价值。此外,该项目还可以用于企业内部的数据中台建设,实现跨部门、跨系统的数据共享和整合,提高数据的利用率和价值。

2025-01-07 09:16:43 1174

原创 AI算法中台系统-让Java能够方便训练、部署、使用AI模型

随着人工智能技术的飞速发展,AI算法在各个行业的应用越来越广泛。然而,对于许多JAVA开发者来说,训练和部署AI模型仍然是一个挑战,因为传统的AI开发流程往往涉及多种语言和工具,如Python用于模型训练,C++用于高性能推理等。为了简化这一流程,gpp平台开源了一个基于SpringBoot+Docker+Cuda+Cudnn+ Pytorch+Onnx+Tensorrt+Yolov8+ffmpeg+zlmediakit的AI算法中台系统。

2025-01-06 11:16:37 1215

原创 智慧仓储系统,

它不仅提高了仓储和物流的效率和准确性,还降低了企业的运营成本和风险,是现代企业提升竞争力的重要手段之一。智能监控:通过传感器和监控系统,实时监测仓库内的环境参数(如温度、湿度、空气质量等)和货物状态,保障货物的安全。预测性维护:物联网技术收集设备运行数据,进行预测性维护,提前发现潜在的故障风险,及时进行维修或更换,避免因设备故障导致的停机损失。基础数据管理:使商品、分类、颜色、尺码、品牌、材质、款式等信息的管理变得轻松高效,为企业的精细化管理提供了有力支持。

2024-12-27 09:40:23 687

原创 通过AI进行高标准农田监管平台

智慧农业-高标准农田监管平台-遥感监测-AI识别。

2024-12-25 14:02:05 527

原创 智慧农场数字大屏-农场数字化

数字孪生是指通过各种传感器,如温度、湿度传感器等集成物理反馈数据,并辅以人工智能、机器学习和软件分析,在信息化平台内创建一个数字化模拟,这个模拟会根据反馈做出相应的变化。

2024-12-23 18:39:51 678

原创 又一个很牛的数字人,可以让憨豆讲普通话

JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation》提出了一种基于扩散模型的音频驱动面部动画生成方法,通过解耦的面部表示框架和扩散变换器实现了面部动态和头部运动的生成。该方法不仅适用于人类肖像动画,还能够生成动物面部动画,具有广泛的应用前景。

2024-12-23 18:34:20 761

原创 基于医疗领域知识图谱的问答系统

知识图谱是一种半结构化数据的表示方法,它用于描述实体、属性和实体之间的关系。知识图谱的核心思想是将现实世界中的信息转化为图形,其中节点表示实体,边表示实体之间的关系。知识图谱不仅包含了对实体和关系的语义描述,还具备可被计算机理解和处理的能力。基于知识图谱的医疗问答系统旨在通过构建医疗领域的知识图谱,实现对医疗知识的语义理解和推理,从而为用户提供准确、详细的医疗问答服务。该系统结合了知识图谱、自然语言处理、数据库和机器学习等多个学科的知识。基于知识图谱的医疗问答系统是一种高效、准确的医疗人工智能应用。

2024-12-23 14:39:08 910

原创 基于深度学习的肿瘤辅助诊断系统

系统以图像分割为核心,利用人工智能完成肿瘤区域的识别勾画并提供肿瘤区域的特征来辅助医生进行诊断。有完整的模型构建、后端架设和前端访问功能。

2024-12-23 14:29:09 305

原创 多角度文字识别:应对复杂环境的智能解决方案

多角度文字识别(Multi-Angle Text Recognition)是指在不同视角、不同光照条件和不同背景下对文本进行识别的技术。这项技术在许多应用场景中都非常重要,例如自动驾驶、智能监控、文档数字化等。

2024-08-09 11:54:05 316

原创 该方法通过基于 cv2.VideoCapture 能够获取视频流入(rtmp/rtsp等)实时帧,能够解决由于图像处理速度不够等原因造成帧堆积的问题。

解决由于图像处理速度不够等原因造成帧堆积的问题

2024-06-25 11:25:34 729

原创 手写轨迹识别数字

使用方法 获取笔迹,笔迹字段为数组,每个对象有3个值,x:笔迹的x值,y:笔迹的y值,action:动作(包含3个动作,down落笔,up抬笔,move移动)使用自定义模板实现了手写识别,目前实现了纯数字的识别,后续正在开发英文数字的识别。

2023-06-03 14:46:40 298 1

原创 提取图像的边缘信息

利用image moment提取图像的边缘信息,所有kernel在RTX 2060上时间6ms

2022-11-04 21:25:02 286

原创 yolov7人脸检测

yolov7人脸检测

2022-11-02 17:52:27 916

原创 图像自研SDK算子

图像算法算子U2FsdGVkX19R0laXM9Q0lTlTY7e775ooBeh1qQOvX8g=

2022-10-28 14:39:27 272

原创 Tensorfllow js 利用ssdlite mobilenetv2(含quantization)进行鞋检测

Tensorfllow js 利用ssdlite mobilenetv2(含quantization)进行鞋检测

2022-10-26 21:33:52 340

原创 通过libusb库和opencv获取usb摄像头图像

通过libusb库和opencv获取usb摄像头图像

2022-10-26 21:23:22 2376

原创 从连接到手机的 OAK-D 设备获取 rgb 和视差图像的 Android 示例

从连接到手机的 OAK-D 设备获取 rgb 和视差图像的 Android 示例

2022-10-26 19:08:18 676 1

原创 从指定 URL 读取图像并以 OpenCV 格式返回的函数(从指定 URL 读取图像并使其可由 OpenCV 处理。)

从指定 URL 读取图像并以 OpenCV 格式返回的函数(从指定 URL 读取图像并使其可由 OpenCV 处理。)

2022-10-26 17:06:51 1222

原创 halcon测量

Halcon中的2D Metrology模块提供了亚像素级别的卡尺测量功能,可以测量的几何形状包括直线、圆、椭圆、矩形。2D测量模型使用起来相对方便,如要测圆的半径,只要设置圆心坐标和模板半径,之后就能在模板半径内设置个测量范围,在测量范围内的边缘会被提取出来,从而自动测出圆的实际半径。

2022-08-22 10:13:06 1245

原创 Halcon二维码识别

Ⅱ.SymbolXLDs (输出围绕成功解码的数据代码符号的 XLD 轮廓,轮廓点的顺序反映了检测符号的方向)(1).创建二维码模型create_data_code_2d_model,用于读取支持类型的二维码。Ⅱ.GenParamName (输入可以为 2D 数据代码模型调整的通用参数的名称)Ⅲ.GenParamValue (输入可以为 2D 数据代码模型调整的通用参数的值)Ⅲ.GenParamValue (输入为 2D 数据代码调整的通用参数的值)Ⅰ.SymbolType (输入二维数据代码的类型)

2022-08-22 10:11:39 1229

原创 深度学习跌倒识别

深度学习跌倒识别深度学习跌倒识别U2FsdGVkX19UuYsqw252xXz5yTF34Rv1EtdooTA0b1Q=

2022-07-11 08:29:03 549 1

原创 深度学习手势识别

手势识别,深度学习U2FsdGVkX180qxwh9Qie8xnMeqYQpYwatySm+2U+0MQ=

2022-07-11 08:26:22 518 2

原创 管理的学问

管理的学问管理的学问丰富而深奥,古今中外的总结与探索从未终止。最近学习了一些优秀管理者的经验,从中概括了几点精要。

2022-07-07 11:06:12 226

原创 人员停留识别

U2FsdGVkX1/ZR2Se9BJ5bhn1W83lzjBLOC0/RSRLSpk=

2022-05-08 10:27:42 490

原创 玻璃瓶缺陷检测

U2FsdGVkX18Meywxmml3kf+hBJINtukolLRUtodyBxw=

2022-05-08 10:22:35 481

证件照和摄像头比对

身份证照片和摄像头照片比对,验证是否是同一个人。一般在验证合法性业务用到。

2015-04-18

PCA-matlab实现人脸识别

人脸识别用ICA算法的方法是一个很好的方法.这里有一个这个算法的demo.这个是用matlab写的.

2009-05-04

一个支持多线程管道服务器

管理服务器可以监听多个多个线程.通过管道传输数据.

2008-01-31

重叠IO的管道服务器程序

支持多客户端,异步传输

2008-01-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除