- 博客(185)
- 资源 (8)
- 收藏
- 关注
原创 Python Opencv: 基于颜色提取的印章分割
利用Python实现了一个图像处理功能,即批量提取图像中的印章区域;使用了颜色聚类的方法来提取颜色。
2024-09-09 15:45:20 1306
原创 mmsegmentation: 安装并使用自定义数据集进行训练
本文从实际的案例出发,介绍了如何在mmsegmentation使用自定义数据集和添加自定义模块,并介绍了安装过程的一些坑;供大家学习交流。
2024-08-13 14:44:20 983
原创 C++: 如何把源码编译成SDK提供第三方使用
在我们开发过程中,经常会遇到提供SDK的情况,对于C++语言,是可以方便地将源码封装成静态库或者动态库然后打包提供给第三方使用的。这样,一方面可以保护源码,另一方面也简化了对方的使用过程。
2024-08-05 08:35:46 1098
原创 PyQT: 开发一款ROI绘制小程序
基于Python和PyQt5框架开发了一款桌面应用程序,允许用户加载图片或视频流,并在这些媒体上绘制感兴趣的区域
2024-07-04 13:45:36 1143 1
原创 Python tkinter: 开发一个目标检测GUI小程序
程序提供了一个用户友好的界面,允许用户选择图片或文件夹,使用行人检测模型进行处理,并在GUI中显示检测结果。用户可以通过点击画布上的检测结果来获取更多信息,并使用键盘快捷键来浏览不同的图片。
2024-07-01 13:46:14 1144
原创 SQLite:一个极简使用教程
SQLite是一个轻量级的、文件系统基础的数据库,它被设计为配置简单、易于部署。SQLite数据库存储在一个单一的磁盘文件中,这意味着数据库的创建和维护都非常简单。
2024-06-25 08:51:31 2341
原创 SCNet: 全1*1卷积的轻量图像超分辨率
深度学习模型尤其是大卷积核(3*3或更大)在单图超分辨率(single image superresolution,SISR)上取得显著进展。然而,庞大的计算量阻碍其在实时、资源受限环境中的应用。相反,1*1卷积在计算效率上能力可观,但却在局部空间表示聚合方面能力不足,而这恰恰却是SISR模型所需要的基本能力。
2024-06-05 09:34:44 774
原创 RKNN:yolov8模型转换与板端推理流程
记录了“yolov8的torch模型转onnx再转rknn,并在瑞芯微RK3588上进行推理验证”的过程。
2024-04-27 14:35:54 4506 20
原创 RepViT:当MobileNet遇到ViT
近期,在资源受限的的移动设备上,轻量ViTs表现出了比CNNs更好的性能和更低的延迟。研究人员发现了轻量级vit和轻量级cnn之间的许多结构联系。然而,尚未充分检查它们之间的块结构、宏观和微观设计的显着架构差异。在这项研究中,我们从 ViT 的角度重新审视轻量级 CNN 的有效设计,并强调它们对移动设备的前景。具体来说,我们通过集成轻量级 ViT 的有效架构设计,逐步增强标准轻量级 CNN(即 MobileNetV3)的移动友好性。这最终得到了一系列新的纯轻量级cnn,即RepViT。
2024-04-24 10:00:04 1205
原创 Minio: 文件类型数据存储
另一种方式是,将这些文件以对象的方式存储到云服务器上,这样既没有丢失风险,也不必担心本地磁盘被撑爆,同时也方便给他人分享数据。我们这里提供了一种客户端实现,可以将文件或者对象上传到指定的服务器路径上,并根据指定的“bucket”进行查询与自动创建。在这里,我们利用了一个叫做Minio的对象存储方式,它可以提供安全、可靠、边界的存储及分享方式。:param bucket_names: 桶名称,用于存放数据的根目录。支持两种上传方式:文件形式、对象形式。:param secret_key: 密码。
2024-04-07 11:39:32 1165
原创 NWPU-MOC:密集多类别目标计数,方法和benchmark
目标计数是CV领域的一个热门任务,其目的在于估计给定图像中的目标个数。然而,当前大多数方法都是针对单类别的,这对于需要同时对多种类别进行计数的场景来说就不适用了,尤其在航拍图中。为了解决这个问题,本文引入了一个多类别目标计数(MOC)任务,来估计在一个航拍图中不同类别目标(如车、建筑、船等)的个数。考虑到缺乏相关数据集,同时也构造了一个包含了3416个场景、1024*1024分辨率、14个精细标注类别的大型数据集——NWPU-MOC。
2024-03-22 10:06:53 1141 2
原创 FcaNet:频率通道注意力,进阶版SE
注意力机制,尤其是通道注意力,在CV领域取得了巨大成功。大部分研究都集中在如何设计更高效的通道注意力机制,却忽略了一个基本问题,也即:他们都是使用全局平均池化(GAP)来作为预处理方法。尽管GAP十分简单高效,但他的捕获的信息也确实不足。对注意力进行重新思考,并从数学上证明了GAP就是频域特征分解的一个特例。基于此,作者将通道注意力机制的预处理泛化到了频域,并基于。2)DCT可以看做输入的加权和,上述DCT公式中的cos部分可以当做权重。在CNN中常用通道注意力来对不同通道的特征进行加权。
2024-03-22 10:05:07 2619 1
原创 YOLO-World初体验:Ultralytics版本,可直接上手,离线运行
YOLOv8官方新增了对YOLO-World的支持,本文利用其提供的模型及接口进行了体验。
2024-02-20 10:17:11 12261 33
原创 RTMO: 超越YOLO-pose的高性能、单阶段、多人姿态估计
提出的RTMO框架如下图所示:网络框架描述如下:输入图像经过backbone(CSPDarknet)后,最后三层feature map经过Hybrid Encoder得到16、32倍下采样的空间feature mapP4、P5,送入Heads;每个Head生成一个得分feature、一个坐标姿态feature,其中坐标姿态feature用于预测bbox、关键点坐标、关键点可见性。****强行插入一段*****:关于坐标分类,没做过的小伙伴可能有点懵,我们可以从SimCC这篇文章中的方法一窥其貌。
2023-12-14 17:14:20 2162
原创 Triton算法服务部署:初识与试用【Hello world】
介绍了Triton,并结合官方文档给出了一个Hello World级别的使用示例。
2023-12-13 09:47:45 463
原创 Flask基本用法:一个HelloWorld,搭建服务、发起请求
Flask是一个轻量的web服务框架,我们可以利用它快速搭建一个服务,对外提供接口,其他人可以轻松调用我们的服务。这对算法工程师来说比较关键,我们通常不擅长搞开发,这种框架十分适合将算法封装成服务的形式提供给其他人使用。更多介绍可从搜索引擎找到,这里不过多介绍。我们直接给出一个使用示例,相信大家看了后能快速掌握Flask的基本用法。
2023-12-13 09:47:20 1404
原创 gRPC基本用法:以人脸识别为例,搭建一个简单的gRPC服务
内含一个完整的人脸识别gRPC服务的github代码;文章以人脸识别为例,提供了一个gRPC的基本用法
2023-12-11 08:38:54 1542
原创 基于点之间距离的多目标跟踪
目标跟踪是计算机视觉领域一种常用的算法,用于将前后帧中的同一个目标关联起来,从而可以针对某一个特定目标进行分析,如对状态进行投票平滑获取更为稳健的结果。然而,目前流行的跟踪算法大多是基于检测的bbox之间的IOU来匹配的,这对于某些小目标或者点的检测,IOU通常不是一个好的选择,因为目标太小,很容易使得相邻两帧之间的IOU为0。为了解决这个问题,本文提出了一种基于点之间距离的跟踪方法:将目标建模为一个点,通过计算前后帧点之间的距离,利用匈牙利匹配来进行跟踪。
2023-11-22 11:15:42 571
原创 MODNet:基于目标分解的实时trimap-free肖像抠图
本文提出了一种轻量级、trimap-free的目标分解网络(MODNet),关键思想是通过显式约束同时优化一系列子目标。此外,还提出了一个高效的 空洞空间金字塔池 (e-ASPP) 模块来融合多尺度特征以进行语义估计,一种自监督子目标一致性(SOC)策略,使MODNet适应真实世界的数据,以解决无trimap方法常见的域转移问题
2023-11-08 13:42:08 1176
原创 Deep Image Matting:深度学习Matting开山之作
在此之前的Matting方法要么是用传统方法,要么是传统+深度学习的组合,他们都难以达到理想效果。因此,本文提出了一个利用trimap来作为辅助输入,并完全使用深度学习方法来进行Matting的方法,这开创了trimap-based Deep Learning Matting的先河。
2023-11-03 14:19:38 407
原创 PP-Matting:trimap free的高精度自然图像抠图
介绍了PP-Matting,一种trimap-free的高精度自然图像抠图方法,通过SCB和HRDB分支分别获取语义上下文和细节特征,从而获取高精度的Matting结果。
2023-11-03 10:57:42 1231
原创 一分钟了解:什么是Image Matting?
Image Matting是图像处理领域的一个基本任务,意为“图像背景抠出”或者“抠图”。这项任务在图像处理、影视制作领域广泛应用。比如,拍电影时常用的扣绿,就是演员在绿幕前面表演,后期再把人物抠出来放到一个新的背景上来表现各种惊险刺激的场景。用一个公式表示Matting就是:,其中F为前景,B为背景,α为透明度,可用0~1之间的小数表示。对于完全为前景的部分α就是1,对于完全为背景的部分α就是0,对于前景背景交界的部分,这些地方有前景但由有一定的透明度,这时α就是一个介于0~1之间的小数。
2023-11-02 14:43:56 1710
原创 AdaBins:使用自适应bins进行深度估计
本文主要解决了从单个RGB输入图像估计高质量密集深度图的问题。我们从一个baseline的encoder-decoder CNN结构出发,提出一个问题:信息的全局处理如何帮助提高整体深度估计?为此,我们提出了一种基于transformer的架构块,它将深度范围划分为多个 bin,而每个bin的中心值是根据每个图像自适应估计的,最终的深度值估计为 bin 中心的线性组合。我们将这种新的构造块称为AdaBins。我们的结果显示,在所有指标上,在几个流行的深度数据集上都比现有技术有了决定性的改进。
2023-10-30 17:29:24 620
原创 PP-MobileSeg: 探索移动设备上又快又准的语义分割模型
transformer在CV领域的成功之后,出现了很多在移动设备上使用它们的尝试性工作,但是这些工作在某些实际应用中的表现仍然不能令人满意。为了解决这个问题,本文提出PP-MobileSeg——一个在移动设备上达到SOTA的语义分割模型。包含了4个stage的StrideFormer backbone 由MV3块和SEA注意力模块构建,能够以最小的参数量提取丰富的语义信息与细节特征;AAM则首先通过语义特征集成投票过滤细节特征,然后将它们与语义特征相结合以增强语义信息;
2023-10-30 14:46:37 949
Linux版文件加密解密小工具
2024-06-26
【windows版】文件加密解密小工具
2024-06-26
抽烟打电话目标检测数据集
2024-06-26
cifar10_cifar100合集.zip
2020-08-14
【全国行政区划对应表】administrative_division_code.sql
2019-06-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人