农夫山泉2号-CSDN博客

原创【arm汇编优化】——rgb图像分离

arm，汇编Code网上有大佬用arm做了一个【Arm端算法优化笔记】一，一步步优化盒子滤波算法，这里我们也体验一下arm的neon assembly加速。这里我们做一个简单的：rgb图像，r，g，b 3通道分割分别采用4种方式实现了：opencv内置函数暴力for循环neon intrinsic的实现neon assembly汇编以上4种方式都单独测试了耗时情况，并将处理结果保存成图片，进行结果检查硬件tx2，armv8-a，64位的处理器0.code0.0 openc.

2021-04-07 18:48:38 688

原创【个人开源】——实时语义分割DDRNet

源码： DDRNet.py关键词: 实时语义分割原理介绍请看又快又强：Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of RoadDeep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road ScenesIntroductionThis is the unofficial .

2021-02-24 20:01:30 5049 28

原创【个人开源】——tensorrt自定义插件,双线性上采样

1. resizebilinear选择5.1的分支。onnx-tensorrtonnx模型：百度网盘，提取码: s7s1

2020-11-18 13:53:34 742

原创【个人项目】——细腻的人像分割

项目地址: segmentation.pytorch前面介绍了，一个人像分割数据集。这里采用该数据做了人像分割的小demo。Supervisely 人像分割数据集格式转换1. 测试1.1 环境采用本机的torch1401.2 下载预训练的模型到ckpt/ade20k-resnet50dilated-ppm_deepsup预训练模型 | 提取码: 67xi1.2 测试python test.py --config config/person-resnet50dilated-ppm_de.

2020-09-14 11:42:04 2945 6

原创【个人开源】论文复现SRN：Towards Accurate Scene Text Recognition with Semantic Reasoning Networks

Towards Accurate Scene Text Recognition with Semantic Reasoning Networkscodehttps://github.com/chenjun2hao/SRN.pytorchUnofficial PyTorch implementation of the paper, which integrates not only globa...

2020-05-12 16:34:19 4512 12

原创【个人开源】和百度类似的口罩检测分类

凑个热闹，和百度类似的口罩检测分类。但是推理速度更快。可以采用pip一键式安装，支持CPU和GPU两种推理模式。视频效果coming soondemohttps://github.com/chenjun2hao/face_mask...

2020-02-28 00:56:55 1284

原创【个人开源】实时人脸检测centerface

the real-time face detection Centerfaceunofficial version of centerface, which achieves the best balance between speed and accuracy. Centerface is a practical anchor-free face detection and alignment...

2020-02-20 19:22:24 2706 44

原创【个人开源】提供预训练结果的ocr标注工具

ocr标注工具提供预训练模型的标注结果采用python-flask框架开发图像标注工具,主要思路是在标注的过程中先调用百度/阿里等免费的api进行标注，并进行人工的验证或目标矩形框的修正，同时支持单张图片多个目标的标注。整理想法很简单，但是实现起来还是很麻烦的。大概用了2周的时间（而且是在开源项目上修改来的）。原特点B/S方式交互支持多人同时标注（可分配不同标注人员的标注范围，或不同人...

2020-01-07 14:11:24 1689

原创【个人开源】2D Attentional Irregular Scene Text Recognizer代码复现

项目地址: https://github.com/chenjun2hao/Bert_OCR.pytorchUnofficial PyTorch implementation of the paper, which transforms the irregular text with 2D layout to character sequence directly via 2D attention...

2019-12-03 18:20:32 956 5

原创 2D Attentional Irregular Scene Text Recognizer代码实现

原理解读参考：2D Attention Network for Scene Text Recognition个人复现的代码:Bert_OCR.pytorch

2019-11-25 17:35:06 870 1

原创 transformerOcr

简介整个项目采用attention ocr的思路进行中文场景文字识别，整个用resnet34采集特征，用transformer的方式做解码器。网络在训练的时候可以并行进行相较于现在常用的GRU做解码器训练速度会快很多。推理的时候还是采用和GRU做解码器同样的方式，将上一步的输出用于下一步的输出，速度并未提升。1. 网络结构...

2019-10-10 13:38:40 2403 8

原创【语义分割数据集】——imagenet语义分割

地址：https://github.com/LUSSeg/ImageNet-S。

2023-12-08 17:17:03 337 1

原创【人脸3D】——如何获得BFM模型其他关键点的索引

通过meshlab看一个标准脸的obj文件，然后通过“edit”——“get info” 可以看mesh中三角片中三个点的索引。这里我们通过“鼻尖的idx进行验证”meshlab中鼻尖的索引。

2023-11-10 09:43:30 324

原创【交互式分割】——数据可视化

ritm, 交互式分割。

2023-10-19 22:49:27 748

原创【目标检测】——PE-YOLO精读

卷积神经网络（CNNs）在近年来如何推动了物体检测的发展。许多检测器已经被提出，而且在许多基准数据集上的性能正在不断提高。然而，大多数现有的检测器都是在正常条件下对高质量图像进行研究。在真实环境中，经常会出现许多糟糕的光照条件，如夜晚、暗光和曝光过度，这些条件会降低图像的质量，影响检测器的性能。前人的解决方案：…略本文采用了金字塔增强网络（PENet）和YOLOv3。首先，PENet使用拉普拉斯金字塔将图像分解为四个不同分辨率的组件。

2023-10-06 22:39:10 1414

原创【目标检测】——Gold-YOLO为啥能超过YOLOV8

基于全局信息融合的概念，提出了一种新的收集和分发机制（GD），用于在YOLO中进行有效的信息交换。通过全局融合多层特征并将全局信息注入到更高的层次，显著增强了NECK的信息融合能力，提高了模型在不同对象大小上的性能。一个浅层收集和分发分支和一个深层收集和分发分支，它们通过卷积基础块和注意力基础块提取和融合特征信息。为了进一步促进信息流动，我们引入了一个轻量级的相邻层融合模块，它在局部范围内结合了来自相邻层的特征。我们的Gold-YOLO架构超越了现有的YOLO系列，有效地展示了我们提出的方法的有效性。

2023-09-26 15:48:49 2345

转载【工具】——VSCODE调试C++时无法显示Vector，map等容器的值

vscode 调试std::vector, std::map

2023-08-03 15:10:21 2605 1

原创【数据集】——SBD数据集下载链接

SBD Dataset 是一个语义边界数据集，其包含来自 PASCAL VOC 2011 数据集中 11355 张图片的注释，这些图片均基于 Amazon Mechanical Turk，其中分割之间的冲突均为手动解决，此外，每张图像均由类别级别和实例界别的分段和边界，适用于 PASCAL VOC 2011 挑战中的 20 个对象类别。该数据集由加州大学·伯克利分校于 2011 年发布，相关论文有《Semantic contours from inverse》。

2023-07-17 20:43:15 827

原创【模型剪枝】——开源项目总结

阿里的一个高效、易用的深度学习模型压缩框架。它包含模型结构搜索、剪枝、量化、模型转换等功能，能将巨大的深度学习模型压缩数倍到数十倍，目前在天猫精灵、海尔电视、优酷视频、人脸打卡机等场景中完成了落地，为超千万的IoT设备提供了AI能力。修剪是一种常用的压缩神经网络模型的技术。修剪方法探索模型权重（参数）中的冗余，并尝试删除/修剪冗余和非关键权重。- 一个通用的PyTorch模型剪枝库。- 实现了多种剪枝算法,如依赖性感知剪枝、L1剪枝等。- Microsoft 提供的多种模型剪枝算法实现。

2023-07-12 19:58:06 449

原创【剪枝】——CNN网络剪枝综述Structured Pruning for Deep Convolutional Neural Networks: A survey

深度卷积神经网络（CNN）的卓越性能通常归因于它们更深、更宽的架构，这可能会带来巨大的计算成本。因此，修剪神经网络已经引起了人们的兴趣，因为它有效地降低了存储和计算成本。与导致非结构化模型的权重修剪不同，结构化修剪通过产生对硬件实现友好的模型，提供了实现加速的好处。结构化修剪的特殊要求导致了许多新挑战的发现和创新解决方案的开发。本文调查了深度CNN结构化修剪的最新进展。我们总结并比较了最先进的结构化修剪技术，包括滤波器排名方法、正则化方法、动态执行、神经架构搜索、彩票假说以及修剪应用。

2023-07-12 10:12:32 318

原创【网络结构】——TinyViT 一种transformer的蒸馏方案

TinyViT是一种新型的小型transformer，它们高效且可以在大规模数据集上进行预训练。TinyViT通过在预训练期间应用蒸馏来传输知识，将大型预训练模型的知识转移到小型模型中，同时使小型模型能够获得大量预训练数据的红利。TinyViT在ImageNet-1k上的最高准确率为84.8％，仅使用21M参数，与在ImageNet-21k上预训练的Swin-B相当，但使用的参数少4.2倍。此外，增加图像分辨率后，TinyViT可以达到86.5％的准确度，略优于Swin-L，同时仅使用11％的参数。

2023-07-06 22:22:28 2182

原创【剪枝】——BIT-PRUNING一种稀疏的无乘法点积方法

点积是神经网络中的一个核心构建模块。然而，点积中的乘法（mult）消耗了大量的能量和空间成本，这对于在资源受限的边缘设备上部署提出了挑战。在这项研究中，我们通过利用无乘法、稀疏的点积来实现节能的神经网络。我们首先将整数权重和激活之间的点积重新公式化为由加法后跟位移（add-shift-add）组成的等效操作。在这种公式化中，加法操作的数量等于二进制格式中整数权重的位数。

2023-06-24 15:17:27 150

原创【论文】——Robust High-Resolution Video Matting with Temporal Guidance浅读

我们介绍了一种稳健、实时、高分辨率的人类视频抠图方法，该方法取得了新的最先进性能。我们的方法比以前的方法轻得多，可以在Nvidia GTX 1080Ti GPU上以76 FPS处理4K，以104 FPS处理HD。与大多数现有的逐帧作为独立图像进行视频抠图的方法不同，我们的方法使用循环架构来利用视频中的时间信息，并在时间一致性和抠图质量方面取得了显著改进。此外，我们提出了一种新的训练策略，强制我们的网络同时满足抠图和分割目标。这显著提高了我们模型的稳健性。

2023-06-04 14:47:42 724

原创【数据生成】——Semantic Image Synthesis via Diffusion Models语义分割数据集生成论文浅读

Denoising Diffusion Probabilistic Models (DDPMs) 在各种图像生成任务中取得了显著的成功，相比之下，生成对抗网络 (GANs) 的表现不尽如人意。最近的语义图像合成工作主要遵循事实上的基于 GAN 的方法，这可能导致生成图像的质量或多样性不尽如人意。在本文中，我们提出了一种基于DDPM 的语义图像合成的新框架。与以前的条件扩散模型直接将语义布局和噪声图像作为输入到 U-Net 结构不同，我们的框架对语义布局和噪声图像进行了不同的处理。

2023-05-01 11:45:02 1686 2

原创【人脸检测】——YOLO5Face: Why Reinventing a Face Detector论文浅读

最近几年在使用卷积神经网络进行人脸检测方面取得了巨大的进展。尽管许多人脸检测器使用专门用于检测人脸的设计，但我们将人脸检测视为一般目标检测任务。我们基于YOLOv5目标检测器实现了一个人脸检测器，并称之为YOLO5Face。我们在其中添加了一个五点地标回归头并使用Wing损失函数。我们设计了不同模型大小的探测器，从大型模型以实现最佳性能，到超小型模型以在嵌入式或移动设备上实时检测。

2023-04-30 17:31:31 1094

原创【人脸检测】——Sample and Computation Redistribution for Efficient Face Detection论文简读

在非受控人脸检测方面已经取得了巨大的进步，但低计算成本和高精度的高效人脸检测仍然是一个开放的挑战。作者提出了两种简单而有效的方法：样本再分配（SR）和计算再分配（CR）。在WIDER FACE上进行的大量实验表明，所提出的SCRFD家族具有SOTA的效率和精度权衡。特别是，SCRFD-34GF的性能比最好的竞争对手TinaFace高出3.86%，同时在VGA分辨率图像的gpu上比TinaFace快3倍以上。图像分辨率的影响直接将分类网络的主干用于目标检测是次优的。

2023-04-28 15:13:56 717

原创【mmdetection】——No module named ‘mmcv._ext‘

需要安装mmcv-full。

2023-04-26 15:56:45 144

原创【海思】——hisi3516不支持relu6的激活函数

mobilenetv2采用的是relu6的激活函数，转caffe是ok的验证和测试通过。

2023-04-17 19:05:51 114

原创【分割】——segment anything论文浅读，分割界的GPT

我们介绍了“分割任何东西”（SA）项目：一项新的图像分割任务、模型和数据集。利用我们高效的模型在数据收集循环中，我们建立了迄今为止最大的分割数据集，拥有超过11百万张经过许可且尊重隐私的图像上的10亿个掩码。该模型经过设计和训练，可以进行提示，因此它可以零点转移到新的图像分布和任务。我们评估了它在众多任务上的能力，并发现它的零点性能令人印象深刻——通常与甚至优于以前的完全监督结果相竞争。

2023-04-06 23:45:00 383

原创【网络结构】——FastViT论文浅读

fastvit，最近transformer和卷积设计的融合，这导致了模型准确性和效率的稳步提高。在这项工作中，我们介绍了FastViT，一种混合视觉变压器架构，它获得了最先进的延迟-准确性折衷。为此，我们引入了一种新颖的令牌混合算子RepMixer，它是FastViT的一个构建块，使用结构重参数化来降低内存访问成本，通过删除网络中的跳过连接。我们进一步应用训练时过参数化和大核卷积来提高准确性，并经验证明这些选择对延迟的影响最小。

2023-03-30 21:16:38 1172 3

原创【多任务】——Multi-Task Learning as Multi-Objective Optimization代码阅读

多任务训练，帕累托优化

2023-03-30 19:51:08 572

转载【多任务】——多任务的训练优化

多任务，训练。

2023-03-30 19:04:02 411

原创【caffe】——ubuntu安装pycaffe

ubuntu安装pycaffe

2023-03-03 18:14:50 342

原创【数据集】——行人+人脸检测框的联合数据集

行人+人脸检测框联合数据集

2023-03-02 14:43:41 163

原创【c/c++】——Linux/cmake 静态库合并

linux/cmake 静态库合并

2022-12-22 23:20:06 1041

原创【pytorch】——exporting the operator relu6 to onnx opset version 13 is not supported

pytorch，f.relu6导出到onnx

2022-12-13 15:51:10 943

原创【mnn】——PTQ离线量化代码梳理

mnn离线量化代码梳理

2022-12-09 13:58:40 413

原创【hisi3516】——IVE yuv420转bgr planner（代码）

用hisi3526dv300 的ive硬件加速yuv2bgr的转换过程

2022-12-07 14:58:01 300

转载 [windows nfs]-如何在Windows上搭建NFS服务器实现开发板与Windows之间的文件共享

windows nfs

2022-12-01 12:36:08 252

原创【hisi】——hisi开发相关文档

海思mpp

2022-11-24 14:05:23 151

hisi3516dv300, 用IVE将yuv420数据转换成bgr，包含源代码和测试数据

hisi3516dv300, 用IVE将yuv420数据转换成bgr，包含源代码和测试数据。

2022-12-07

armv7白皮书:ARM Architecture Reference Manual ARMv7-A and ARMv7-R edition

armv7白皮书，包含指令集等

2021-04-07

armv8的白皮书:Arm Architecture Reference Manual Armv8, for Armv8-A architecture

armv8的白皮书，为官方文档包含架构讲解，neon函数，指令集等。文件为百度网盘下载链接。

2021-04-07

download_scannet.zip

scannet数据下载的python脚本。

2021-01-27

pybind11 python调用c++拓展的例子

采用pybind11模块来实现python调用c++程序的两个例子，具体可以看：文章：https://blog.csdn.net/u011622208/article/details/111302047

2020-12-16

tensorrt5.1双线性上采样插件

针对tensorrt5.1实现的双线性上采样插件，插件实测无误。如果用nvidia的gpu，在推理的时候，采用tensorrt进行加速是一个很好的选择，虽然tensorrt没有开源。

2020-11-17

opencv_cuda.tar.gz

利用cuda加速opencv图像处理的例子——交换mat的r，b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速，使用过程需要管理CPU与GPU之间的数据传输，内核函数调用参数的设置，内核函数的优化等。优点是处理过程受控于用户，用户可以实现更多的并行加速处理操作。

2020-11-10

cuda向量加法cmake编译

采用cmake编译cuda向量加法。　在大量的C/C++的项目中都使用CMake来进行项目的管理，而CUDA又是很流行的并行计算库，利用CMake来构建CUDA项目就显得很有必要了，而且项目中使用的CMakeLists.txt基本框架一致。

2020-11-10

AMD-APP-SDK-v2.8-Windows-64.exe的安装文件

64位windows amd平台的opencl安装软件。安装之后sample在：C:\Users\xx\Documents\AMD APP\

2020-08-28

faiss_install.zip

Faiss是Facebook AI团队开源的针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意：编译器不同，可能无法使用。

2020-08-06

Hi3519A编译好的YOLOV3 demo百度网盘下载链接

Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的，这就让人很不开心，而且华为的人给的资料很乱，其次，很多的demo都是支持Hi3559A的，还没入坑的，推荐选Hi3559A进行开发。

2020-04-28

python多文件夹/文件夹依赖关系制作pip安装包

将文件夹打包成pip安装包，网络上大多是单个文件夹，且不存在文件（同文件夹/不同文件夹）直接的相互调用。使用环境有限。该包尝试将多个文件夹/文件之间存在相互调用的项目打包成一个pip包。

2020-02-27

ocr_annotation-master.zip

采用python-flask框架开发图像标注工具,主要思路是在标注的过程中先调用百度/阿里等免费的api进行标注，并进行人工的验证或目标矩形框的修正，同时支持单张图片多个目标的标注。整理想法很简单，但是实现起来还是很麻烦的。大概用了2周的时间（而且是在开源项目上修改来的）

2020-01-07

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification.pdf

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification的论文pdf

2019-08-02

pig_coco.py

我们一般使用的数据格式是voc2007的数据格式，有时我们也需要用coco数据格式，这种格式一般以json格式存储，那么如将voc2007格式的数据转成coco数据格式呢？这是python的代码实现，只用改路径就好。

2019-07-03

支持向量机线性可分matlab程序

采用matlab自带的quadprog（）函数对支持向量机模型进行求解。整个文件夹包含测试用数据集，可运行。

2018-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人