自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI数据工厂

Python应用、cv数据处理、论文笔记、深度学习、目标检测、语义分割相关知识点分享

  • 博客(182)
  • 收藏
  • 关注

原创 PyQT: 开发一款ROI绘制小程序

基于Python和PyQt5框架开发了一款桌面应用程序,允许用户加载图片或视频流,并在这些媒体上绘制感兴趣的区域

2024-07-04 13:45:36 1009 1

原创 Python tkinter: 开发一个目标检测GUI小程序

程序提供了一个用户友好的界面,允许用户选择图片或文件夹,使用行人检测模型进行处理,并在GUI中显示检测结果。用户可以通过点击画布上的检测结果来获取更多信息,并使用键盘快捷键来浏览不同的图片。

2024-07-01 13:46:14 1045

原创 Python Tkinter:开发一款文件加密解密小工具

介绍了一款自行研发的文件加解密的小工具,可以从源码/可执行程序运行。

2024-07-01 13:45:00 795

原创 SQLite:一个极简使用教程

SQLite是一个轻量级的、文件系统基础的数据库,它被设计为配置简单、易于部署。SQLite数据库存储在一个单一的磁盘文件中,这意味着数据库的创建和维护都非常简单。

2024-06-25 08:51:31 936

原创 SCNet: 全1*1卷积的轻量图像超分辨率

深度学习模型尤其是大卷积核(3*3或更大)在单图超分辨率(single image superresolution,SISR)上取得显著进展。然而,庞大的计算量阻碍其在实时、资源受限环境中的应用。相反,1*1卷积在计算效率上能力可观,但却在局部空间表示聚合方面能力不足,而这恰恰却是SISR模型所需要的基本能力。

2024-06-05 09:34:44 635

原创 PeLK: 大卷积核强势回归,高达101 × 101,提出了外围卷积

PeLK:超大卷积核,高达101*101!

2024-04-27 14:45:42 1732

原创 RKNN:yolov8模型转换与板端推理流程

记录了“yolov8的torch模型转onnx再转rknn,并在瑞芯微RK3588上进行推理验证”的过程。

2024-04-27 14:35:54 3082 13

原创 ShuffleMixer:一个高效的图像超分辨率卷积网络

介绍了一篇关于轻量SR的论文——ShuffleMixer

2024-04-25 13:36:44 816

原创 RepViT:当MobileNet遇到ViT

近期,在资源受限的的移动设备上,轻量ViTs表现出了比CNNs更好的性能和更低的延迟。研究人员发现了轻量级vit和轻量级cnn之间的许多结构联系。然而,尚未充分检查它们之间的块结构、宏观和微观设计的显着架构差异。在这项研究中,我们从 ViT 的角度重新审视轻量级 CNN 的有效设计,并强调它们对移动设备的前景。具体来说,我们通过集成轻量级 ViT 的有效架构设计,逐步增强标准轻量级 CNN(即 MobileNetV3)的移动友好性。这最终得到了一系列新的纯轻量级cnn,即RepViT。

2024-04-24 10:00:04 1073

原创 Python语法糖大全

Python语法糖大全,汇总了各种语法糖,可以作为一个查询手册。

2024-04-24 09:40:00 2506 1

原创 FSRCNN:加速超分辨率卷积神经网络,SRCNN的加速版

FSRCNN:改进版的SRCNN,速度更快、性能更高!

2024-04-23 09:17:03 1179 3

原创 SRCNN:深度学习单图超分开山之作【附代码】

介绍了单图SR开山之作——SRCNN,并给出了网络结构的实现代码。

2024-04-23 09:16:39 1672 4

原创 Minio: 文件类型数据存储

另一种方式是,将这些文件以对象的方式存储到云服务器上,这样既没有丢失风险,也不必担心本地磁盘被撑爆,同时也方便给他人分享数据。我们这里提供了一种客户端实现,可以将文件或者对象上传到指定的服务器路径上,并根据指定的“bucket”进行查询与自动创建。在这里,我们利用了一个叫做Minio的对象存储方式,它可以提供安全、可靠、边界的存储及分享方式。:param bucket_names: 桶名称,用于存放数据的根目录。支持两种上传方式:文件形式、对象形式。:param secret_key: 密码。

2024-04-07 11:39:32 1083

原创 MQTT:通过消息队列进行消息传递

简要介绍了一个利用消息队列进行算法结果上传的方法,并给出了Python代码实现。

2024-04-07 11:38:37 989

原创 NWPU-MOC:密集多类别目标计数,方法和benchmark

目标计数是CV领域的一个热门任务,其目的在于估计给定图像中的目标个数。然而,当前大多数方法都是针对单类别的,这对于需要同时对多种类别进行计数的场景来说就不适用了,尤其在航拍图中。为了解决这个问题,本文引入了一个多类别目标计数(MOC)任务,来估计在一个航拍图中不同类别目标(如车、建筑、船等)的个数。考虑到缺乏相关数据集,同时也构造了一个包含了3416个场景、1024*1024分辨率、14个精细标注类别的大型数据集——NWPU-MOC。

2024-03-22 10:06:53 948 2

原创 FcaNet:频率通道注意力,进阶版SE

注意力机制,尤其是通道注意力,在CV领域取得了巨大成功。大部分研究都集中在如何设计更高效的通道注意力机制,却忽略了一个基本问题,也即:他们都是使用全局平均池化(GAP)来作为预处理方法。尽管GAP十分简单高效,但他的捕获的信息也确实不足。对注意力进行重新思考,并从数学上证明了GAP就是频域特征分解的一个特例。基于此,作者将通道注意力机制的预处理泛化到了频域,并基于。2)DCT可以看做输入的加权和,上述DCT公式中的cos部分可以当做权重。在CNN中常用通道注意力来对不同通道的特征进行加权。

2024-03-22 10:05:07 2053 1

原创 YOLO-World初体验:Ultralytics版本,可直接上手,离线运行

YOLOv8官方新增了对YOLO-World的支持,本文利用其提供的模型及接口进行了体验。

2024-02-20 10:17:11 9780 33

原创 YOLO-World:实时开放词汇目标检测

本文通读了YOLO-World的论文,翻译了其关键内容。

2024-02-20 10:17:01 2738

原创 Objects365数据集下载与信息统计

介绍了Objects365数据集,并提供了百度网盘下载链接;同时,给出了数据集的统计信息。

2024-01-30 08:28:47 2136 3

原创 RTMO: 超越YOLO-pose的高性能、单阶段、多人姿态估计

提出的RTMO框架如下图所示:网络框架描述如下:输入图像经过backbone(CSPDarknet)后,最后三层feature map经过Hybrid Encoder得到16、32倍下采样的空间feature mapP4、P5,送入Heads;每个Head生成一个得分feature、一个坐标姿态feature,其中坐标姿态feature用于预测bbox、关键点坐标、关键点可见性。****强行插入一段*****:关于坐标分类,没做过的小伙伴可能有点懵,我们可以从SimCC这篇文章中的方法一窥其貌。

2023-12-14 17:14:20 1698

原创 Triton算法服务部署:初识与试用【Hello world】

介绍了Triton,并结合官方文档给出了一个Hello World级别的使用示例。

2023-12-13 09:47:45 405

原创 Flask基本用法:一个HelloWorld,搭建服务、发起请求

Flask是一个轻量的web服务框架,我们可以利用它快速搭建一个服务,对外提供接口,其他人可以轻松调用我们的服务。这对算法工程师来说比较关键,我们通常不擅长搞开发,这种框架十分适合将算法封装成服务的形式提供给其他人使用。更多介绍可从搜索引擎找到,这里不过多介绍。我们直接给出一个使用示例,相信大家看了后能快速掌握Flask的基本用法。

2023-12-13 09:47:20 1304

原创 gRPC基本用法:以人脸识别为例,搭建一个简单的gRPC服务

内含一个完整的人脸识别gRPC服务的github代码;文章以人脸识别为例,提供了一个gRPC的基本用法

2023-12-11 08:38:54 1507

原创 【媒体开发】利用FFMPEG进行推拉流

给出了一种利用FFMPEG进行推拉流的方法与使用步骤

2023-12-11 08:38:31 1845

原创 T-Rex:检测一切 | 基于视觉提示的开集检测器,检测并计数

T-Rex,一种开集检测一切、计数一切、实例分割一切的模型,主页可以试玩。

2023-11-29 11:38:03 2625

原创 基于点之间距离的多目标跟踪

目标跟踪是计算机视觉领域一种常用的算法,用于将前后帧中的同一个目标关联起来,从而可以针对某一个特定目标进行分析,如对状态进行投票平滑获取更为稳健的结果。然而,目前流行的跟踪算法大多是基于检测的bbox之间的IOU来匹配的,这对于某些小目标或者点的检测,IOU通常不是一个好的选择,因为目标太小,很容易使得相邻两帧之间的IOU为0。为了解决这个问题,本文提出了一种基于点之间距离的跟踪方法:将目标建模为一个点,通过计算前后帧点之间的距离,利用匈牙利匹配来进行跟踪。

2023-11-22 11:15:42 537

原创 MODNet:基于目标分解的实时trimap-free肖像抠图

本文提出了一种轻量级、trimap-free的目标分解网络(MODNet),关键思想是通过显式约束同时优化一系列子目标。此外,还提出了一个高效的 空洞空间金字塔池 (e-ASPP) 模块来融合多尺度特征以进行语义估计,一种自监督子目标一致性(SOC)策略,使MODNet适应真实世界的数据,以解决无trimap方法常见的域转移问题

2023-11-08 13:42:08 1060

原创 Python中 lambda 的妙用

Python中使用lambda高效处理一些问题的案例

2023-11-08 13:41:17 207

原创 Deep Image Matting:深度学习Matting开山之作

在此之前的Matting方法要么是用传统方法,要么是传统+深度学习的组合,他们都难以达到理想效果。因此,本文提出了一个利用trimap来作为辅助输入,并完全使用深度学习方法来进行Matting的方法,这开创了trimap-based Deep Learning Matting的先河。

2023-11-03 14:19:38 378

原创 PP-Matting:trimap free的高精度自然图像抠图

介绍了PP-Matting,一种trimap-free的高精度自然图像抠图方法,通过SCB和HRDB分支分别获取语义上下文和细节特征,从而获取高精度的Matting结果。

2023-11-03 10:57:42 1040

原创 几种常见的Matting数据集【附度盘下载链接】

本文整理了多种Matting数据集,可一键下载~

2023-11-03 10:51:25 550

原创 YOLACT: 实时实例分割

one-stage实时实例分割网络——YOLACT,论文解读

2023-11-02 14:45:43 265

原创 一分钟了解:什么是Image Matting?

Image Matting是图像处理领域的一个基本任务,意为“图像背景抠出”或者“抠图”。这项任务在图像处理、影视制作领域广泛应用。比如,拍电影时常用的扣绿,就是演员在绿幕前面表演,后期再把人物抠出来放到一个新的背景上来表现各种惊险刺激的场景。用一个公式表示Matting就是:,其中F为前景,B为背景,α为透明度,可用0~1之间的小数表示。对于完全为前景的部分α就是1,对于完全为背景的部分α就是0,对于前景背景交界的部分,这些地方有前景但由有一定的透明度,这时α就是一个介于0~1之间的小数。

2023-11-02 14:43:56 1387

原创 AdaBins:使用自适应bins进行深度估计

本文主要解决了从单个RGB输入图像估计高质量密集深度图的问题。我们从一个baseline的encoder-decoder CNN结构出发,提出一个问题:信息的全局处理如何帮助提高整体深度估计?为此,我们提出了一种基于transformer的架构块,它将深度范围划分为多个 bin,而每个bin的中心值是根据每个图像自适应估计的,最终的深度值估计为 bin 中心的线性组合。我们将这种新的构造块称为AdaBins。我们的结果显示,在所有指标上,在几个流行的深度数据集上都比现有技术有了决定性的改进。

2023-10-30 17:29:24 515

原创 PP-MobileSeg: 探索移动设备上又快又准的语义分割模型

transformer在CV领域的成功之后,出现了很多在移动设备上使用它们的尝试性工作,但是这些工作在某些实际应用中的表现仍然不能令人满意。为了解决这个问题,本文提出PP-MobileSeg——一个在移动设备上达到SOTA的语义分割模型。包含了4个stage的StrideFormer backbone 由MV3块和SEA注意力模块构建,能够以最小的参数量提取丰富的语义信息与细节特征;AAM则首先通过语义特征集成投票过滤细节特征,然后将它们与语义特征相结合以增强语义信息;

2023-10-30 14:46:37 804

原创 C++ opencv:视频读取、变换颜色风格、保存

C++ opencv视频读写、图片风格变换

2023-08-08 17:04:02 633

原创 linux安装C++ opencv

在linux中安装C++版opencv

2023-08-08 10:27:34 3035

原创 一种人体属性识别的网络结构

人体属性识别,是一个典型的多标签分类场景。每个人体有多个标签,如年龄、性别、衣着颜色等,而每个属性又有多种类别,如年龄分儿童青年老人、性别分男女、颜色分红绿青蓝紫...本文提供了一个网络结构来执行这种任务。

2023-06-22 21:25:25 410

原创 使用双向投影直方图进行裂缝分类

本文提供了一种使用传统图像处理方法对裂缝种类进行分类的方法,并提供了代码、测试效果等内容。

2023-06-22 21:22:34 290

原创 判断一个mask是否近似直线

本文提供了一种判断物体是否近似直线的解决思路,以及对应的实现代码。

2023-06-22 21:21:36 150

Linux版文件加密解密小工具

在这个信息泄露风险日益增加的时代,使用文件加密工具对于保护个人隐私和企业机密至关重要。 这里介绍了一款基于Python Tkinter GUI实现的小工具——encryptDecrypt,它不仅提供了一个易于使用的图形界面,简化了加密和解密过程,还确保了数据的安全性,帮助用户遵守数据保护法规,同时尊重和保障了信息的隐私性。 该加密/解密工具的特性主要体现在以下几个方面: 数据保护: 随着网络攻击和数据泄露事件的日益增多,加密是保护数据不被未授权访问的有效手段。 遵守法规: 许多国家和地区都有严格的数据保护法规,如欧盟的通用数据保护条例(GDPR),加密工具帮助组织和个人遵守这些法规。 隐私尊重: 对于处理敏感信息的个人和企业来说,加密是尊重用户隐私和建立信任的重要方式。 便捷操作: 该工具提供了一个简单易用的图形界面,使得没有专业加密知识的用户也能轻松进行文件的加密和解密,降低了使用门槛。 灵活性: 用户可以根据自己的需求生成和加载密钥,对不同文件使用不同的加密策略,提供灵活的加密选项。 本地化处理: 加密和解密过程在用户本地计算机上完成,无需上传数据到第三方服务器;

2024-06-26

【windows版】文件加密解密小工具

在这个信息泄露风险日益增加的时代,使用文件加密工具对于保护个人隐私和企业机密至关重要。 这里介绍了一款基于Python Tkinter GUI实现的小工具——encryptDecrypt,它不仅提供了一个易于使用的图形界面,简化了加密和解密过程,还确保了数据的安全性,帮助用户遵守数据保护法规,同时尊重和保障了信息的隐私性。 该加密/解密工具的特性主要体现在以下几个方面: 数据保护: 随着网络攻击和数据泄露事件的日益增多,加密是保护数据不被未授权访问的有效手段。 遵守法规: 许多国家和地区都有严格的数据保护法规,如欧盟的通用数据保护条例(GDPR),加密工具帮助组织和个人遵守这些法规。 隐私尊重: 对于处理敏感信息的个人和企业来说,加密是尊重用户隐私和建立信任的重要方式。 便捷操作: 该工具提供了一个简单易用的图形界面,使得没有专业加密知识的用户也能轻松进行文件的加密和解密,降低了使用门槛。 灵活性: 用户可以根据自己的需求生成和加载密钥,对不同文件使用不同的加密策略,提供灵活的加密选项。 本地化处理: 加密和解密过程在用户本地计算机上完成,无需上传数据到第三方服务器;

2024-06-26

抽烟打电话目标检测数据集

1559张标注好的yolo格式的目标检测数据集,可以直接用于YOLO系列模型的训练。 标注示例: 1 0.7974683544303798 0.5 0.16455696202531644 0.2777777777777778 说明:1代表类别,后面四个值为bbox的坐标(x1, y1, x2, y2)。

2024-06-26

cifar10_cifar100合集.zip

python版本的cifar10/cifar100合集,可下载后解压到自定义路径下使用。原下载地址:http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz,http://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz

2020-08-14

【全国行政区划对应表】administrative_division_code.sql

身份证各个字段对应的省市区等行政划分: CREATE TABLE `administrative_division_code` ( `sno` int(11) NOT NULL, `province_id` int(2) NOT NULL COMMENT '省级代码(前两位)', `city_id` int(4) NOT NULL COMMENT '地市级代码(前4位)', `district_id` int(6) NOT NULL COMMENT '县区级代码(前6位)', `province_name` varchar(50) NOT NULL COMMENT '省级全称', `province_name_ab` varchar(10) NOT NULL COMMENT '省级简称', `city_name` varchar(50) NOT NULL COMMENT '地市级名称', `district_name` varchar(50) DEFAULT NULL COMMENT '区县级名称', `remark` varchar(1000) DEFAULT NULL COMMENT '备注', `flag` int(1) NOT NULL DEFAULT '1' COMMENT '大陆区划', PRIMARY KEY (`sno`), KEY `idx_adc_province_id` (`province_id`) USING BTREE, KEY `idx_adc_city_id` (`city_id`) USING BTREE, KEY `idx_adc_district_id` (`district_id`) USING BTREE )

2019-06-26

吴恩达《机器学习训练秘籍》中文版

此文档为吴恩达《机器学习训练秘籍》的中文版,旨在帮助大家快速构建自己的机器学习项目。不得不说:老吴出品,必属精品~

2018-11-22

opencv人脸/人眼/人体识别分类器

opencv已训练好的haarcascades分类器,共22个,包括了人脸、人眼、人体等各种分类器。

2018-09-07

拯救纠结症患者

利用Python编写小程序,并打包成exe文件,可在不同电脑上执行。 一个小功能:用户输入自己需要选择的项,系统智能判断,给出结果。

2018-08-27

Python包:baidumapAPI

此为Python包,利用百度地图API实现指定经纬度,返回相应的省市区等位置信息。

2018-08-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除