自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI小小怪的博客

探索计算机视觉的边界,架起图像处理与深度学习的桥梁。在这里,像素被赋予意义,算法获得视觉。分享OpenCV实战技巧、YOLO创新应用、模型优化之道,共同构建能够真正“看见”与“理解”的机器智能。

  • 博客(29)
  • 收藏
  • 关注

原创 YOLOv8制作自己的目标检测数据集保姆级教程(包含json转xml转txt)

本文的实验是进行目标检测,数据集以及相关代码我放在了一起,方便今后相似数据集的制作。

2024-01-09 09:59:25 26437 113

原创 行人重识别(Deep-Person-ReID)自定义数据集制作及训练全流程(包含利用自己的原始数据制作ReID数据集)

本文详细介绍了行人重识别(ReID)从数据集制作到模型训练的全流程。主要内容包括:1)将原始数据集转换为Market1501标准格式的脚本实现;2)Deep-Person-ReID框架的环境配置与训练参数详解;3)模型训练、测试评估及结果可视化方法;4)常见问题解决方案。文章提供了完整的Python代码实现数据格式转换,并详细解析了训练配置参数,帮助读者快速构建自己的ReID系统。

2026-01-24 16:06:41 867 1

原创 行人重识别(Deep-Person-ReID)环境搭建与实战教程:从环境配置到模型训练测试

本文详细介绍了基于PyTorch的行人重识别(ReID)系统搭建全流程。主要内容包括:1)使用conda创建Python3.10虚拟环境并安装PyTorch和deep-person-reid库;2)准备Market-1501等常用数据集;3)配置模型训练参数,包括网络结构选择、数据增强、损失函数等;4)执行训练和测试流程;5)结果评估指标解读(mAP、Rank-k等);6)常见问题解决方案。文章提供了完整的代码实现和参数配置说明,适合计算机视觉研究者快速搭建ReID系统。

2025-12-27 17:07:23 1236 1

原创 Label Studio 安装与使用保姆级教程(包含本地服务器数据导入和标签模板)

LabelStudio是一款开源的多功能数据标注工具,支持图像、文本、音频等多种数据类型标注。它具有多项目管理、团队协作、机器学习集成等功能,可通过Docker、pip或源码等方式安装。使用流程包括:创建项目、导入数据、配置标注模板、进行标注和导出结果。该工具提供预置模板和自定义界面功能,支持多种导出格式,并能集成ML模型进行预标注,适合个人和团队的数据标注需求。

2025-11-06 17:24:34 9827 9

原创 在Linux服务器上安装CVAT (Docker 28.5.1)

摘要:本文详细介绍了在Ubuntu系统上部署CVAT标注工具2.48.0与Docker 28.5.1的完整流程。主要内容包括:1) 系统环境要求;2) Docker环境的详细安装步骤,包含国内镜像源配置;3) CVAT的安装配置要点,特别提供了针对国内网络的优化方案;4) 服务启动与管理方法;5) 管理员账户创建和访问验证。文档还包含常见问题排查指南、数据备份方案以及维护建议,特别强调了版本兼容性和系统资源监控的重要性,为国内用户提供了完整的部署解决方案。

2025-11-05 15:12:45 852

原创 YOLOv11 实例分割标注一键转旋转检测框(附转换思路+代码框架)

本文介绍如何将实例分割的多边形标注自动转换为旋转框(Rotated Bounding Box)格式,以提升目标检测模型在倾斜目标场景下的性能。通过OpenCV的minAreaRect()函数,可高效地将多边形点集拟合为最小外接旋转矩形,并转换为YOLO旋转框格式(class_index x1y1x2y2x3y3x4y4)。文章提供了完整Python代码实现归一化坐标处理、数据验证和批量转换功能,强调需注意角度归一化、尺寸验证等关键细节。

2025-10-29 17:00:24 1362

原创 YOLOv11 实例分割标注转成目标检测框教程(附完整代码)

本文介绍了一种高效的Python脚本方案,可以将实例分割标注数据快速转换为YOLOv11目标检测模型所需的边界框格式。通过自动计算分割多边形的最小外接矩形,实现一键格式转换,避免了手动重标数据的繁琐过程。文章详细讲解了转换原理(三点式流程:读取坐标、计算外接矩形、归一化格式),提供了完整可复用的代码,并给出简单易懂的两步使用说明。这套方案能大幅提升数据预处理效率,特别适合已有分割数据但需要训练检测模型的使用场景。

2025-10-29 16:06:43 596 2

原创 YOLOv8 实例分割优势与原理详解

YOLOv8实例分割是一种高效的实时实例分割模型,采用统一架构设计,支持检测、分割和分类任务。其核心创新包括改进的CSPDarknet53骨干网络、优化的PAN-FPN结构以及Anchor-Free检测机制。模型通过原型头输出全局基础掩码,检测头为每个实例生成掩码系数,通过矩阵相乘动态解码出实例专属掩码。该模型提供多种规格,适用于工业视觉、医疗影像、自动驾驶等场景,具有高效、准确、易用的特点。关键优势在于将目标检测和实例分割统一到单次前向传播中,同时保持实时性能和高精度。

2025-09-29 11:47:12 1973 10

原创 Linux下编译MMCV

MMCV是OpenMMLab计算机视觉项目的基础库,提供mmcv(完整版)和mmcv-lite(精简版)两个版本。完整版包含CUDA算子但构建时间长,精简版不含CUDA算子但功能完整。安装前需确保PyTorch已正确安装,并检查CUDA和gcc版本。通过克隆仓库、安装依赖、执行构建命令即可完成安装,最后可用验证脚本确认安装成功。该库支持mmdetection、mmsegmentation等OpenMMLab系列项目。

2025-09-11 09:31:22 1256 2

原创 在linux下使用MySQL常用的命令集合

本文介绍了MySQL数据库常用操作命令,包括:1.数据库操作(查看/选择数据库);2.表操作(查看表结构/创建语句);3.数据查询(基础/条件/排序查询);4.统计聚合(计数/求和/分组);5.系统信息(版本/用户/进程查看);6.实用技巧(执行计划/表大小分析)。文章提供了命令模板和示例,强调需替换实际数据库名、表名和字段名,建议复杂查询使用EXPLAIN分析性能,生产环境查询应添加LIMIT限制。

2025-09-03 16:06:01 681

原创 关于yolov5训练数据增加但模型效果下降的原因分析

当模型性能随数据量增加而下降时,可能原因包括:1)新增数据质量差(标注错误/噪声);2)数据分布变化(场景差异/冗余样本);3)训练策略未适配(学习率/批次大小未调整);4)类别不平衡加剧;5)模型容量不足;6)验证集污染。解决方案:清洗数据、调整超参数、增强正则化、更换大模型,并分阶段验证数据质量。关键是通过数据检查、分布分析和训练监控逐步排查问题。

2025-08-11 15:40:17 677

原创 Linux下成功编译CPU版Caffe的保姆级教程(基于Anaconda Python3.8 包含完整可用Makefile.config文件)

本文详细介绍了在Linux系统下使用Anaconda Python3.8环境编译CPU版本Caffe的完整流程。内容包括:1. 环境准备,包括安装Ubuntu系统依赖和Anaconda配置;2. 源代码获取与配置调整,重点修改Makefile.config中的Python路径和依赖库设置;3. 解决常见编译问题,如numpy路径、boost-python版本、HDF5配置等;4. Python接口安装和MNIST测试验证。文章提供了详细的配置示例和常见错误解决方案,特别针对Python3兼容性问题给出了修改

2025-06-14 17:40:18 1408 1

原创 Linux下编译ncnn

在linux下同时编译生成ncnn的静态链接库和动态链接库,支持Vulkan加速功能

2025-04-28 14:56:36 773

原创 Linux下编译并打包MNN项目迁移至其他设备

在Linux下利用MNN框架对MTCNN网络进行推理,实现对目标的实时检测,本文主要实现工程编译并打包MNN项目迁移至其他设备

2025-04-26 14:19:23 1304

原创 Linux下编译openjpeg(静态链接库和动态链接库)

Linux下编译openjpeg(静态链接库和动态链接库)。在linux下编译包含opencv静态链接库的工程时,可能会报 cannot find -lopenjp2 的错误一般是OpenJPEG 静态库存在问题,本文着重介绍如何解决这种问题。

2025-04-26 10:14:41 834

原创 Linux下编译MNN

在linux下编译MNN动态库和静态库

2025-04-25 16:58:48 1203

原创 亲测成功❗❗❗Linux下编译opencv-4.10.0(静态链接库和动态链接库)

在Linux下同时编译opencv静态链接库和动态链接库

2025-04-24 11:40:26 2589 1

原创 Linux下编译protobuf-3.11.2

在Linux系统下编译protobuf-3.11.2

2025-04-24 10:44:09 595

原创 在Linux环境下利用MTCNN进行人脸检测(基于ncnn架构)

本文将详细介绍如何在Linux环境下部署MTCNN模型进行人脸检测,并使用ncnn框架进行推理。目录1. CMake的安装与配置2. Protobuf的安装3. OpenCV库的安装与配置4. ncnn库在Linux环境下的编译5. MTCNN源码6. Linux下进行推理

2025-02-26 16:27:14 1273

原创 基于yolov5与dlib+opencv的头部姿态估计(内附完整代码)

在计算机视觉领域,头部姿态估计(HeadPoseEstimation)是一项重要的任务,它可以帮助我们理解人类的行为和情感。本文将介绍如何结合YOLOv5和Dlib+OpenCV来实现这一任务。我们将使用YOLOv5进行视频中的人脸检测,然后使用Dlib进行人脸关键点检测,最后通过这些关键点来估计头部的姿态。

2024-12-25 15:18:31 2361 1

原创 完美解决❗❗❗yolov8多卡训练报错subprocess.CalledProcessError: Command‘[‘....‘]‘ returned non-zero exit status 1.

完美解决在利用多GPU训练yolov8时遇到的如下错误Error: mkl-service + Intel(R) MKL: MKL_THREADING_LAYER=INTEL is incompatible with libgomp-a34b3233.so.1 library. Try to import numpy first or set the threading layer accordingly. Set MKL_SERVICE_FORCE_INTEL to force it.

2024-11-26 11:05:02 1919 1

原创 完美解决❗❗❗在Linux环境下导入MySQLdb库导致的Segmentation fault (core dumped)问题

在Linux环境下导入MySQLdb库导致的Segmentation fault (core dumped)问题,同时也解决了ModuleNotFoundError: No module named 'MySQLdb'的问题。

2024-11-18 14:45:00 915 1

原创 完美解决,无需降版本❗❗❗报错FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated.

近期跑YOLO系列模型的时候遇到的一个问题,虽然不算是一个错误吧,但是运行的时候这个警告会刷屏,很烦人,强迫症受不了,必须解决了。

2024-10-16 17:35:26 19010 14

原创 YOLOv8制作自己的实例分割数据集保姆级教程(包含json转txt)

本文的实验是进行实例分割,数据集以及相关代码我放在了一起,方便今后相似数据集的制作。

2024-05-23 16:54:54 13143 19

原创 YOLOv8目标检测 opencv模型部署保姆级教程(包含opencv环境配置)

本文详细讲解了如何将训练好的YOLOv8模型导出成onnx格式并利用opencv进行部署。

2024-05-22 13:42:19 5892 2

原创 notepad++最新版下载(无需翻墙❗❗❗无需进入官网❗❗❗亲测有效)

notepad++最新版下载(无需翻墙!!!无需进入官网!!!亲测有效)

2024-03-16 16:54:06 12147 2

原创 利用python将json文件转化为xml文件

利用Labelme标注完图像得到json文件,而yolo训练需要xml文件。需要将json文件转换为xml文件,代码如下。

2023-12-07 14:40:56 2358 2

原创 网页视频倍速

打开视频播放页,按F12,找到控制台(Console)在控制台里面粘贴以下代码(其中之一即可),按回车。可根据自己的需求调节数值大小。

2023-09-01 10:10:09 27979 12

原创 JS网页自动刷新脚本

应用场景:Chrome浏览器一、使用流程:1.在Chrome地址栏输入需要的网址;2.按F12打开开发者工具,找到控制台(console);3.将下面的脚本代码复制到控制台内,敲回车键即可执行。4.在弹出的时间设置框内输入刷新时间间隔(该间隔以秒为单位),点击确定,页面将自动根据时间间隔刷新。

2023-08-10 16:36:49 7449 1

X-AnyLabeling-CPU.exe

以往我们常见的有 LabelImg 和 Labelme 两款非常经典且主流的本地标注,但随着要标注的数据量越来越大,再熟练的标注大师也顶不住全手工标注了,丸辣!于是就诞生了一些半自动、全自动甚至用到大语言模型辅助的标准工具,帮助数据标注人员提高效率。 下面推荐 X-AnyLabeling 一款先进的自动标注工具,可以导入YOLO11、SAM2、PP-OCR等非常多先进的通用模型辅助打标签,支持Windows、Linux和MacOS平台,支持CPU和GPU加速模型推理,支持从图像到视频到文本等等,导出目前能见到的绝大多数的数据集格式,它即涵盖了LabelImg 和 Labelme 的所有功能,还能先标注一部分数据集,训练一个半成品模型出来,进一步辅助你自动标注完剩下的大量数据集,然后你只需要做后续的微调和审查工作,节省了大量时间和重复劳动。

2025-10-31

X-AnyLabeling.zip

以往我们常见的有 LabelImg 和 Labelme 两款非常经典且主流的本地标注,但随着要标注的数据量越来越大,再熟练的标注大师也顶不住全手工标注了,丸辣!于是就诞生了一些半自动、全自动甚至用到大语言模型辅助的标准工具,帮助数据标注人员提高效率。 下面推荐 X-AnyLabeling 一款先进的自动标注工具,可以导入YOLO11、SAM2、PP-OCR等非常多先进的通用模型辅助打标签,支持Windows、Linux和MacOS平台,支持CPU和GPU加速模型推理,支持从图像到视频到文本等等,导出目前能见到的绝大多数的数据集格式,它即涵盖了LabelImg 和 Labelme 的所有功能,还能先标注一部分数据集,训练一个半成品模型出来,进一步辅助你自动标注完剩下的大量数据集,然后你只需要做后续的微调和审查工作,节省了大量时间和重复劳动。

2025-10-30

mmcv-2.1.0.zip

MMCV 有两个主要版本,mmcv 和 mmcv-lite。 mmcv 是全面版本,包含所有的特性以及丰富的开箱即用的 CUDA 算子,但构建时间较长; mmcvlite 是精简版,不包含 CUDA 算子,但拥有其他所有功能,适用于不需要 CUDA 算子的场 景,类似于 MMCV 早期版本(mmcv < 1.0.0)。 MMCV 支持 OpenMMLab 下的众多计算机视觉相关的开源项目,如 mmdetection(目标检测工具 箱和基准)、mmsegmentation(语义分割工具箱和基准)、mmpose(姿态估计工具箱和基 准)、mmaction2(动作理解工具箱和基准)、mmclassification(图像分类工具箱和基准)等。

2025-09-11

caffe编译makefile文件

caffe编译makefile文件,适用于仅CPU,python3.6版本,使用conda环境中的python和Boost包,同时使用linux系统环境中的protobuf包

2025-06-23

snpe-1.68(完整版).rar

Snapdragon Neural Processing Engine (SNPE) 是 Qualcomm 提供的一套完整的解决方案,旨在优化和加速神经网络模型在 Qualcomm 骁龙(Snapdragon)移动平台上的运行。SNPE 支持多种神经网络框架,如 TensorFlow、Caffe、ONNX 等,并提供了高效的推理引擎和工具链,帮助开发者在移动设备上实现高性能的人工智能应用。 Snapdragon Neural Processing Engine (SNPE) 是由高通公司(Qualcomm)开发的一套软件开发工具包,其目的在于为开发者提供一系列优化和加速神经网络模型在高通骁龙移动平台上的运行能力。随着人工智能技术在移动设备上的普及和重要性的日益增加,SNPE成为了推动移动AI应用发展的关键工具。 SNPE支持多种流行的深度学习框架,包括但不限于TensorFlow、Caffe以及ONNX(开放神经网络交换格式),这使得开发者能够利用他们已有的模型和知识,将这些模型转换并部署在骁龙处理器上。这样的支持为开发者提供极大的便利,因为它们不必从零开始构建模型,而是可以在现有的成果基础上进行优化和调整。 SNPE的核心组件之一是其高效的推理引擎,推理引擎是深度学习模型执行前向传播计算的部分,它负责处理输入数据并生成预测结果。在移动设备上运行复杂的神经网络模型时,高效的推理引擎是至关重要的,因为它能够确保应用运行流畅且电池消耗合理。 此外,SNPE还提供了一系列工具链,这些工具链包括模型转换工具、调试工具和性能分析工具,它们帮助开发者在模型转换、调试和优化等阶段中更有效地工作。例如,模型转换工具可以将特定框架的模型转换为SNPE可以识别和运行的格式,而性能分析工具则允许开发者了解模型在特定硬件上的运行效率,进而作出相应的调整。

2025-04-27

openjpeg-version.2.1.zip

openjpeg是C语言实现的开源[jpeg2000]2图像格式的编码/解码器,github上有编译好的linux/windows二进制文件,目前最新的版本是2.1 但官方提供的二进制文件只提供了dll,如果想要将代码静态编译到项目中需要自己下载源代码编译。

2025-04-26

protobuf-3.11.2.zip

Protobuf(Protocol Buffers)协议Protobuf 是一种由 Google 开发的二进制序列化格式和相关的技术,它用于高效地序列化和反序列化结构化数据,通常用于网络通信、数据存储等场景。 Protobuf 在许多领域都得到了广泛应用,特别是在分布式系统、RPC(Remote Procedure Call)框架和数据存储中,它提供了一种高效、简洁和可扩展的方式来序列化和交换数据,Protobuf 的主要优点包括: 高效性:Protobuf 序列化后的二进制数据通常比其他序列化格式(比如超级常用的JSON)更小,并且序列化和反序列化的速度更快,这对于性能敏感的应用非常有益。 简洁性:Protobuf 使用一种定义消息格式的语法,它允许定义字段类型、顺序和规则(消息结构更加清晰和简洁) 版本兼容性:Protobuf 支持向前和向后兼容的版本控制,使得在消息格式发生变化时可以更容易地处理不同版本的通信。 语言无关性:Protobuf 定义的消息格式可以在多种编程语言中使用,这有助于跨语言的通信和数据交换(截至本文发布目前官方支持的有C++/C#/Dart/Go/Java/Kotlin/python) 自动生成代码:Protobuf 通常与相应的工具一起使用,可以自动生成代码,包括序列化/反序列化代码和相关的类(减少了手动编写代码的工作量,提高效率)

2025-04-24

clangd-linux-19.1.2.zip

clangd工具为解析compile_commands.json并生成所有符号表索引数据库,方便只参与编译的文件代码进行快速跳转。

2025-03-11

vscode-server-linux-x64.tar.gz

code-server是一个社区项目(非微软官方)其作用是在你的linux主机(云服务器)上部署一个可以在浏览器上访问的vscode页面,类似官方的vscode.dev

2025-03-10

SNPE-Tutorial-main.zip

‌SNPE(Snapdragon Neural Processing Engine)是高通公司推出的一款面向移动端和物联网设备的深度学习推理框架‌。它提供了一套完整的深度学习推理解决方案,能够支持多种深度学习模型,包括PyTorch、TFLite、ONNX和TensorFlow等‌

2025-03-10

boost-1-87-0.tar.gz

Boost是为C++语言标准库提供扩展的一些C++程序库的总称。Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一,是为C++语言标准库提供扩展的一些C++程序库的总称。 Boost库由C++标准委员会库工作组成员发起,其中有些内容有望成为下一代C++标准库内容。在C++社区中影响甚大,是不折不扣的“准”标准库。 Boost由于其对跨平台的强调,对标准C++的强调,与编写平台无关。但Boost中也有很多是实验性质的东西,在实际的开发中使用需要谨慎。

2025-03-10

MTCNN-ncnn权重.zip

文件目录结构 ncnn/ └── models ├── det1.bin ├── det1.param ├── det2.bin ├── det2.param ├── det3.bin └── det3.param

2025-02-26

Qualcomm Neural Processing SDK.zip

Qualcomm Neural Processing SDK 是高通(Qualcomm)推出的一款软件开发工具包(SDK),旨在帮助开发者在搭载高通骁龙(Snapdragon)处理器的设备上高效运行人工智能(AI)和机器学习(ML)模型。该 SDK 充分利用了骁龙芯片中的异构计算能力,包括 CPU、GPU 和专用的神经处理单元(NPU,也称为 AI 引擎),以实现高性能、低功耗的 AI 推理。 1. 支持多种 AI 框架 2. 异构计算支持 3. 模型优化 4. 跨平台支持 5. 低功耗设计

2025-02-25

DeepSeek-V3-main.zip

我们提出了DeepSeek-V3,这是一个强大的混合专家(MoE)语言模型,总参数为671B,每个令牌激活37B。为了实现高效的推理和经济高效的训练,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了充分的验证。此外,DeepSeek-V3开创了一种用于负载平衡的辅助无损耗策略,并设定了多令牌预测训练目标,以获得更强的性能。

2025-02-25

fdm-x64-setup-6.22.rar

好用且免费的多线程下载器

2025-02-25

Netron-Setup-8.1.6.exe

Netron 是一个开源的深度学习和机器学习模型可视化工具,它能够以图形化的方式展示各种深度神经网络、机器学习模型及其内部结构。开发者可以使用 Netron 来直观地理解、调试和验证不同框架生成的模型文件。 跨平台支持:Netron 可以在多种操作系统上运行,包括 Windows、macOS 和 Linux,并且有浏览器版本可以直接在线使用。本文将不安装其他软件,展示在浏览器上使用的方法。 广泛兼容性:Netron 支持多种深度学习框架产生的模型格式,如 ONNX (Open Neural Network Exchange)、TensorFlow、Keras、Caffe、Core ML、PyTorch、MXNet、PaddlePaddle 等。 可视化内容:通过 Netron,用户可以看到模型的层级结构(每一层的名称、类型、输入和输出维度等),以及模型参数的具体数值(如果模型文件中包含的话)。 交互式界面:提供了一个简洁易用的图形用户界面,用户可以通过点击和滚动来探索模型的细节,便于对复杂的模型架构进行快速解读。 实用功能:除了基本的可视化之外,Netron 还提供了诸如查看权重张量、

2025-02-11

mnn-3.0.0-windows-x64-cpu-opencl.zip

MNN(Mobile Neural Network)是阿里巴巴集团推出的一个轻量级、高性能的深度学习推理引擎,专为移动设备和边缘计算设备设计。MNN旨在提供高效的模型部署能力,支持多种深度学习框架的模型转换和优化,适用于各种移动端应用场景。 主要特点 轻量级: MNN的设计目标是尽量减小内存占用和计算资源消耗,使其能够在资源受限的移动设备上高效运行。 高性能: 通过优化计算图、利用硬件加速(如GPU、NPU)和多线程技术,MNN能够实现高效的模型推理。 多平台支持: MNN支持多种操作系统和硬件平台,包括Android、iOS、Linux和Windows等。 丰富的模型支持: MNN支持多种深度学习框架的模型转换,如TensorFlow、Caffe、ONNX等,方便开发者将现有的模型迁移到MNN上。 易于集成: 提供了简洁的API和详细的文档,使得开发者可以轻松地将MNN集成到自己的应用中。 模块化设计: MNN采用了模块化的设计,可以根据需要选择不同的组件,如后端计算库、模型优化器等。

2025-02-10

MNN-3.0.0.zip

MNN(Mobile Neural Network)是阿里巴巴集团推出的一个轻量级、高性能的深度学习推理引擎,专为移动设备和边缘计算设备设计。MNN旨在提供高效的模型部署能力,支持多种深度学习框架的模型转换和优化,适用于各种移动端应用场景。 主要特点 轻量级: MNN的设计目标是尽量减小内存占用和计算资源消耗,使其能够在资源受限的移动设备上高效运行。 高性能: 通过优化计算图、利用硬件加速(如GPU、NPU)和多线程技术,MNN能够实现高效的模型推理。 多平台支持: MNN支持多种操作系统和硬件平台,包括Android、iOS、Linux和Windows等。 丰富的模型支持: MNN支持多种深度学习框架的模型转换,如TensorFlow、Caffe、ONNX等,方便开发者将现有的模型迁移到MNN上。 易于集成: 提供了简洁的API和详细的文档,使得开发者可以轻松地将MNN集成到自己的应用中。 模块化设计: MNN采用了模块化的设计,可以根据需要选择不同的组件,如后端计算库、模型优化器等。

2025-02-10

ncnn-20241226-android.zip

NCNN(Neural Network Inference Framework)是由腾讯优图实验室开发的一个高性能、轻量级的神经网络推理框架,专为移动设备和嵌入式系统设计。NCNN的目标是在保证模型推理速度和精度的同时,最大限度地减少内存占用和计算资源消耗,使其能够在资源受限的环境中高效运行。 主要特点 轻量级: NCNN的设计非常紧凑,代码量小,内存占用低,非常适合在移动设备和嵌入式系统上部署。 高性能: 通过优化计算图、利用硬件加速(如GPU、DSP等)和多线程技术,NCNN能够实现高效的模型推理。 跨平台支持: NCNN支持多种操作系统和硬件平台,包括Android、iOS、Linux、Windows等。 丰富的模型支持: NCNN支持多种深度学习框架的模型转换,如Caffe、TensorFlow、PyTorch等,方便开发者将现有的模型迁移到NCNN上。 易于集成: 提供了简洁的API和详细的文档,使得开发者可以轻松地将NCNN集成到自己的应用中。 模块化设计: NCNN采用了模块化的设计,可以根据需要选择不同的组件,如后端计算库、模型优化器等。

2025-02-10

WPS-Setup-19770.exe

wps最新版,点击即可获取,无需前往官网

2025-02-10

PDF Candy.rar

DF转换和其他PDF工具的在线服务 PDF Candy是Icecream公司开发的一款提供免费PDF转换和其他PDF工具的在线服务,采用在线与桌面并存的双平台策略。 该工具支持PDF与Word、JPG、HTML、EPUB、MOBI等20余种格式互转,并具备合并、拆分、加密、添加水印、OCR文本识别、AI辅助等47项功能,支持批量处理且无文件大小限制。 其免费版存在使用频次与文件大小限制,并提供付费订阅方案。 其在线服务始于2019年10月(首发44项功能),2024年7月增加OCR识别与元数据编辑,同年11月推出集成50+功能的桌面版。 桌面版支持Windows系统离线操作,后续版本持续更新,例如2025年9月更新、2026年的v3.13版本以及v3.15和v3.17等版本。

2026-04-11

常用word简历模板.zip

里面包含了100多份求职,升学等常用的简历模板,非常实用,都是可编辑的

2026-04-11

TotalUninstaller.zip

Total Uninstall 可以轻松移除任何程序 精确分析已安装程序 使用 Total Uninstall 的“已安装程序”模块可以分析已安装程序并创建安装日志。这可用于执行彻底的程序卸载,即使没有自身卸载程序的帮助。 监视新程序的安装过程 使用 Total Uninstall 的“已监视程序” 模块可以帮助您监视新安装程序对您系统所做的更改。 便于您在没有自身卸载程序帮助的情况下彻底删除程序留下的文件。 安全清理系统 移除多余的文件和注册表项目 Autorun Manager handles start-up. 管理 Windows 启动过程。控制随系统自启动的程序,服务和计划任务。 通过禁用不想要的自启动程序,使操作系统运行的更快速。 转移程序到新 PC 上 此功能与独立程序同等重要。引导 您将程序从一台计算机上转移到另一台计算机上

2026-04-11

verycapture1.7.2.zip

verycapture 是一款专业的PC电脑端屏幕捕获软件。具体点说的话,那就是支持 多种模式截图、录屏、录音、甚至是录制gif动图!如果仅是这些功能,它还称不上办公小神器。强大的OCR文字识别提取,再加上多国语言自动翻译功能,使用它在办公工作中提供了巨大的帮助

2026-04-11

手写模拟器v1.0.rar

模拟真人手写笔记的一款软件

2026-04-11

EndNote 20大客户版.zip

EndNote 是一款专业的‌文献管理软件‌,主要用于‌科研学术写作中的文献收集、管理与参考文献格式化‌,帮助科研人员高效处理海量文献并规范论文引用 文献收集与管理 ‌高效导入与整理‌:支持从 Web of Science、PubMed 等各大数据库一键导入文献信息,也可批量导入本地 PDF 文件并自动提取题录 。‌‌‌ ‌个性化文献库‌:允许用户创建个人文献数据库,进行分组分类、去重、标记星标及添加阅读笔记,方便快速检索与回顾 。‌‌ ‌全文管理‌:能够关联和管理文献全文 PDF,支持在软件内直接阅读、高亮标注及查找全文 。‌

2026-04-11

ResourceHacker资源编辑器.zip

Resource Hacker 是由加拿大开发者 Angus Johnson 开发的免费软件工具,主要用于对 Windows 平台可执行文件进行可视化资源编辑,支持包括 .exe、.dll、.scr 等格式在内的 Win32 可执行文件及资源库的操作。 该工具提供资源查看、提取、修改、添加与删除功能,涵盖图标、位图、菜单、对话框等二十余种资源类型。用户可通过内置资源编译器与反编译器将资源导出为二进制文件或反编译为 .rc 脚本,并支持通过替换图像文件或导入 .res 文件实现资源修改。其脚本编辑器支持直接编辑对话框布局与菜单结构,兼容 Delphi 和C Builder开发环境,同时提供命令行接口实现自动化操作(如多语言资源注入与冗余资源清理) 。软件采用免安装绿色版本设计,兼容 Windows 全系列操作系统,支持 32 位及 64 位程序处理。

2026-04-11

XFrog v5.4 DC12182015 for Cinema 4D R17.rar

Cinema 4D 的前身是1989年发表的软件 FastRay 最初只发表在 Amiga上,Amiga 是一种早期的个人电脑系统,当时还没有图形界面。 两年后,在 1991 年 FastRay 更新到了 1.0。但是,这个软件当时还并没有有涉及到三维领域。1993年 FastRay 更名为 CINEMA 4D 1.0,仍然在 Amiga 上发布。 模块组件: MoGraph 系统:在 Cinema 4D 9.6 版本中首次出现,他将提供给艺术家一个全新的维度和方法,又为 Cinema 4D 添上了一个绝对利器。它将类似矩阵式的制图模式变的极为简单有效而且极为方便,一个单一的物体,经过奇妙的排列和组合,并且配合各种效应器的帮助,用户会发现单调的简单图形也会有不可思议的效果。 毛发系统:Cinema 4D 所开发的毛发系统也是迄今为止最强大的系统之一。 Advanced Render:高级渲染模块。Cinema 4d 的渲染插件非常强大,可以渲染出极为逼真的效果。 BodyPaint 3D :三维纹理绘画使用这个模块可以直接在三维模型上进行绘画,有多种笔触支持压感和图层功能,功能强大。 Dynamics:动力学模块提供了模拟真实物理环境的功能,通过这个模拟的空间可以实现例如重力、风力、质量、刚体、柔体等效果。 MOCCA:骨架系统,多用于角色设计。 NET Render:网络渲染模块,可以将几台电脑用网络连接起来,进行同时渲染,可以大大增加渲染速度。 PyroCluster:云雾系统 Sketch & Toon:二维渲染插件,可以模拟二维的效果,例如马克笔效果、毛笔效果、素描效果等。 Thinking Particles:粒子系统

2026-04-11

MicroKMS-v21.12.08-Beta.exe

KMS(密钥管理服务)是微软公司于2006年随Windows Vista推出的企业级批量激活机制,旨在通过局域网集中管理操作系统授权以加强正版验证,取代存在泄露风险的VOL版系统,面向购买批量许可协议的企业用户。该服务需在企业内网部署专用KMS服务器并安装CSVLK主机密钥,经微软激活服务认证后可为客户端提供激活支持 。客户端需安装通用批量许可证密钥(GVLK),通过DNS自动发现KMS服务器并建立连接,每180天需续期激活且服务器需满足最低激活阈值(25台客户端或5台服务器)。技术实现依赖slmgr脚本工具配置密钥与服务器地址,支持从Windows Vista至最新系统的批量激活及虚拟机集群部署。微软官方明确禁止跨版本使用密钥,公共网络中的第三方KMS服务器及本地续期方案均未获官方认可。

2026-04-11

fdm-x64-setup.exe

完全免费的多功能的下载和管理工具 Free Download Manager(FDM)是一款基于GNU通用公共许可证的开源免费下载管理工具,支持Windows、macOS、Linux及Android等多平台运行,提供包含中文在内的30种语言界面 。软件支持HTTP、FTP、BitTorrent等协议,采用多线程技术和断点续传功能提升下载效率,并具备站点目录浏览、HTML蜘蛛整站抓取及镜像下载加速能力。 用户可通过便携模式、远程任务控制及流量调节优化下载体验,支持音视频预览与格式转换,并利用BT插件扩展协议支持 。软件提供智能文件分类、计划任务排程及自定义版本功能,允许用户定制界面元素与推广链接。2020-2022年间Linux版本曾遭恶意篡改,建议通过官方渠道下载以确保安全。最低系统需求为Windows 7,持续更新至2025年7月发布的6.29版本,包含新界面与功能增强 。

2026-04-11

系统发育树构建所需.zip

现代系统发育树的构建主要依赖于分子数据(如16S rRNA基因序列、全基因组)和计算机算法,其方法主要分为两类: ‌基于距离的方法‌:先计算序列之间的进化距离,再根据距离构建树。常见方法包括‌邻接法(Neighbor-Joining, NJ)‌和‌最小进化法(Minimum Evolution, ME)‌。这类方法计算速度通常较快。‌‌‌‌ 5 ‌基于特征的方法‌:直接利用序列的性状(特征)数据构建树,致力于找到最符合进化规律的树形。 ‌最大简约法(Maximum Parsimony, MP)‌:寻找进化步骤(如突变次数)最少的树,适用于序列差异较小的情况。‌‌‌‌ 7 ‌最大似然法(Maximum Likelihood, ML)‌:基于统计进化模型,寻找最有可能产生观测序列数据的树,对大数据集和复杂模型适用性强。‌‌‌ 5‌ ‌贝叶斯推断法(Bayesian Inference, BI)‌:利用贝叶斯统计计算后验概率来构建树。‌‌‌ 5 一个完整的构建流程通常包括:1) ‌序列选择与比对‌(确保序列同源,常用软件如Clustal, MAFFT, MUSCLE);2) ‌选择建树方法与模型‌(根据数据特点选择上述方法及替换模型);3) ‌运行软件构建树‌(常用工具包括MEGA, PHYLIP, RAxML, FastTree, MrBayes等);4) ‌树结构评估与可视化‌(常用Bootstrap值评估可靠性,一般认为大于70较为可靠,并用TreeView, iTOL, FigTree等软件美化)

2026-04-11

Retouch Pro 3.0.1.zip

ps插件 Retouch Pro面板是迄今为止摄影行业中最先进的PS面板,具有150多种功能。Retouch Pro专为专业和业余摄影师,编辑和图形设计师而创建。Retouch Pro 面板有一个非常强大和先进的人工智能系统,与 Photoshop 一样,它允许用户更快地获得结果和专业结果,只需单击一下,即可修改眼睛、嘴唇、嘴和面部形式,或一键将照片中的主题剪切出来。

2026-04-11

最满意的10款-旁门左道PPT.zip

最满意的10款-旁门左道PPT

2026-04-11

autojs6-v6.6.4-arm64-v8a.apk

AutoJs6是一款功能强大的开源安卓自动化工具,基于JavaScript语言开发,旨在帮助用户轻松实现设备操作的自动化,大幅提升工作效率。作为一款无需Root权限即可运行的实用工具,它通过简洁的脚本编写方式,让普通用户也能快速上手,完成各种复杂的自动化任务。无论是日常的手机操作,还是专业的应用测试,AutoJs6都能提供完美的解决方案。

2026-03-06

labelimg-v1.8.1.zip

labelimg是一款开源的图像标注工具,标签可用于分类和目标检测,它是用python写的,并使用Qt作为其图形界面,简单好用(虽然是英文版的)。其注释以 PASCAL VOC格式保存为XML文件,这是ImageNet使用的格式。此外,它还支持 COCO数据集格式。

2025-12-31

Market-1501-v15.09.15

2015年,论文 Person Re-Identification Meets Image Search 提出了 Market 1501 数据集,现在 Market 1501 数据集已经成为行人重识别领域最常用的数据集之一。 Market 1501 的行人图片采集自清华大学校园的 6 个摄像头,一共标注了 1501 个行人。其中,751 个行人标注用于训练集,750 个行人标注用于测试集,训练集和测试集中没有重复的行人 ID,也就是说出现在训练集中的 751 个行人均未出现在测试集中。 训练集:751 个行人,12936 张图片 测试集:750 个行人,19732 张图片 query 集:750 个行人,3368 张图片 query 集的行人图片都是手动标注的图片,从 6 个摄像头中为测试集中的每个行人选取一张图片,构成 query 集。测试集中的每个行人至多有 6 张图片,query 集共有 3368 张图片。 网络模型训练时,会用到训练集;测试模型好坏时,会用到测试集和 query 集。此时测试集也被称作 gallery 集。因此实际用到的子集为,训练集、gallery 集 和 query 集。

2025-12-27

boxmot-master.zip

boxmot由mikel brostrom开发,用于目标检测,分割和姿态估计模型的SOTA(state of art)跟踪模块,现已加入python第三方库 PYPI,可用pip包管理器进行安装。 boxmot所支持的跟踪器采用外观特征识别方法,如重型ReID(CLIRdID)和轻型ReID(LightMBN, OSNet等),来识别不同图像帧中同一个目标。这些ReID权文件在运行boxmot时自动下载,无需事先下载checkpoint文件。 boxmot目前支持的对象检测模型有:yolov8, yolo-NAS和YOLOX。支持的跟踪器:BoTSORT, DeepOCSORT, OCSORT, HybridSORT, ByteTrack, StrongSORT。之前常用的DeepSort由增强型的StrongSORT取代。 boxmot可以看作一个软件封装器,将多种对象检测模型与不同的目标跟踪器组合,实现多目标跟踪。

2025-12-27

deep-person-reid-master.zip

行人重识别(Person Re-identification也称行人再识别,简称为ReID,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术;或者说,行人重识别是指在已有的可能来源与非重叠摄像机视域的视频序列中识别出目标行人。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。在监控视频中,由于相机分辨率和拍摄角度的缘故,通常无法得到质量非常高的人脸图片。当人脸识别失效的情况下,ReID就成为了一个非常重要的替代品技术。ReID有一个非常重要的特性就是跨摄像头,所以学术论文里评价性能的时候,是要检索出不同摄像头下的相同行人图片。

2025-12-27

cvat-2.48.0

适用范围:用于注释数字图像和视频。CVAT 支持与对象检测、图像分类和图像分割相关的监督式机器学习任务。 标注类型:它使用户能够使用四种类型的形状对图像进行注释:框、多边形(通常和用于分割任务)、折线(可用于注释道路上的标记)和点(例如,用于注释面部特征或姿态估计)。 便捷工具:CVAT 还提供有助于执行典型注释任务的功能,例如许多自动化工具(包括使用 TensorFlow对象检测 API 复制和传播对象、插值和自动注释的功能)、视觉设置、快捷方式、过滤器等。

2025-11-07

label-studio-1.21.0

Label Studio 是一个开源的数据标注工具。它允许您通过简单直观的 UI 标注音频、文本、图像、视频和时间序列等多种数据类型,并可以导出为各种模型格式。它既可以用于准备原始数据,也可以改进现有的训练数据以获得更准确的 ML 模型。

2025-11-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除