2020年03月_农夫山泉2号

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创【论文阅读】CentripetalNet：目标检测新网络，COCO 48 % AP超现所有Anchor-free网络

转载自:https://mp.weixin.qq.com/s/rpqDpXJA2OBHhGjkBUDPXQ尊重原创，请读原文论文：代码：关键词： anchor-free， coco48%

2020-03-31 23:37:28 743

转载【opencv】树莓派安装opencv

转载自:https://www.jianshu.com/p/56929416b4a1

2020-03-31 13:21:51 290

可以参考：https://blog.csdn.net/sinat_31425585/article/details/100586033这里是根据配置文件，创建相关的layer，就是定义相关的层，声明内存空间等。这里和darknet差别还是很大的。darknet的源码更容易阅读。ncnn做了几层封装，第一眼看到的时候，肯定是????的。整个流程：第一部分通过类的名字const char* typ...

2020-03-30 22:27:35 958

转载【C++】C/C++语言的一些技巧

转载自:https://blog.csdn.net/sen_blog/article/details/9665763#include <iostream>//typedef int CCLayer;class CCLayer{};class ActionManual:public CCLayer{public: ActionManual() {...

2020-03-30 14:56:12 426

原创【ncnn】源码阅读理解（一）——例子注释

Code#include <opencv2\opencv.hpp>#include <map>#include <vector> #include <algorithm> #include <functional> #include <cstdlib> #include <iostream>#...

2020-03-29 12:54:07 1278

转载【C++】pair及pair在vector中的使用

转载自:https://blog.csdn.net/qq_35962520/article/details/816288521. pair1.1 定义（构造）：pair<int ,double> p1;//默认构造函数pair<int ,double> p2(1, 2.4);//用给定值初始化pair<int ,double> p3(p2);//拷贝构...

2020-03-29 12:31:22 2410

原创【ncnn】win10 vs2015编译ncnn项目

1. 编译protobuf这是google开源的一个项目，ncnn用来序列保存网络模型的。1.1 下载protobuf，从这个博客1.2 编译protobuf看网络上的文章，这里有两种方式可以编译protobuf。采用cmake-gui采用vs2015命令行因为编译opencv的时候用的cmake-gui，这里用vs命令行试一下。参考：https://blog.csdn.net...

2020-03-29 00:35:20 2226 4

原创【darknet】源码阅读理解（六）——maxpool的前向传播/反向传播

maxpool是用于数据特征降维，减少CNN网络的计算量，是CNN的基础组件之一。1. 前向传播前向传播就是在channel通道上，对一定size*size的正方形区域求出最大值，作为下一层layer的输入。同时，为了反向误差的传播需要保存最大值所对应的索引indexCodevoid forward_maxpool_layer(const maxpool_layer l, network...

2020-03-28 20:37:42 784

原创【darknet】阅读理解（5）——batchnorm和activation

1. batchnorm1.1 原理大致的原理可以参考:https://blog.csdn.net/qq_25737169/article/details/79048516如果了解个大概的话，就是：（x-均值）/ 偏差 * 缩放系数 + 一个偏置1.2 darknet实现说明：darknet cpu采用C实现的，能更有助于原理的理解或者也可以用numpy等高级框架实现总之，...

2020-03-28 12:41:36 591

原创【darknet】源码阅读理解（三）——CNN前向传播

这里以Code，原理相结合的方式1. darknet中CNN关键代码1. int m = l.n/l.groups; // 输出通道 int k = l.size*l.size*l.c/l.groups; // img2col后图像矩阵的行数 int n = l.out_w*l...

2020-03-27 18:48:00 831

原创【树莓派】树莓派4B无法运行64位程序

问题：在linux_x64上动态链接库无法在树莓派4B上运行尝试一官方推出了，检查boot目录下是否有kernel8.img如果没有就 rpi-update然后添加arm_64bit=1到config.txt执行uname -a 你会看到内核从v7l（armhf）变v8（arm64）了结果：还是不行，getconf LONG_BIT 还是32尝试二:安装一个64位的系统。。。...

2020-03-27 17:57:10 2324 1

转载【darknet】源码阅读理解（四）——#pragma omp parallel for

参考自:https://www.cnblogs.com/qinguoyi/p/7251305.html出处： darknet在cpu上进行CNN计算时。Code：void gemm_nn(int M, int N, int K, float ALPHA, float *A, int lda, float *B, int ldb, float...

2020-03-27 17:01:56 617

原创【darknet】解读（二）——预训练模型加载

。。。。

2020-03-26 22:48:09 634

原创【基础工具】树莓派文件管理器闪退

sudo apt-get install --reinstall pcmanfm

2020-03-26 18:44:54 1277

原创【darknet】解读（一）

layer filters size input output 0 conv 32 3 x 3 / 1 608 x 608 x 3 -> 608 x 608 x 32 0.639 BFLOPs 1 conv 64 3 x 3 / 2 608 x 608 x 32...

2020-03-26 00:12:24 456

原创【文字识别】UnrealText: Synthesizing Realistic Scene Text Images from the Unreal World论文阅读

类别：文本合成来源： CVPR2020，旷视code： https://jyouhou.github.io/UnrealText/摘要：合成数据是训练场景文本检测和识别模型的关键工具。一方面，在场景文本识别器的训练中，合成词图像已被证明是真实图像的成功替代品。然而，另一方面，场景文本检测器仍然严重依赖于大量手工注释的真实世界图像，这是非常昂贵的。在本文中，我们介绍了一种有效的图像合成方法...

2020-03-25 09:07:34 1467

原创【人脸检测】ubuntu16.04编译libfacedetection

参考自:https://blog.csdn.net/qq_36470920/article/details/887151351. 修改cmakelist.txt打开cmake的demo编译选项option(DEMO "build the demo" ON)2. 编译mkdir buildcd buildcmake ..make3. 测试cd build./detect...

2020-03-24 11:15:06 676 4

原创【darknet】win10 vscode单步调试darknet配置

参考自:https://www.cnblogs.com/ranjiewen/p/10214728.html,https://blog.csdn.net/xxmhnu/article/details/802800061. 安装vscode2. 编译darknet将darknet中makefile的CC=gcc改为 CC=gcc -g参考：https://blog.csdn.net/u0...

2020-03-24 00:09:03 1384

原创【C++】SeetaFace2在Windows10 VS2015编译调试

参考:https://blog.csdn.net/sinat_33896833/article/details/1001835811. 下载seetaface源代码git clone https://github.com/seetafaceengine/SeetaFace2.git2. 用cmake.gui编译在seetaface2根目录下新建一个build文件夹选择CMakeLis...

2020-03-23 15:04:09 803 3

原创【基础工具】win10 clion配置cygwin

可参考:https://blog.csdn.net/qq_36819130/article/details/78668249但是我前面已经安装了MinGW，我的流程是：先卸载Mingw删除“环境变量”再装Cygwin将Cygmin/bin加入到环境变量配置clion安装的时候主要要选择gcc-core、gcc-g++、make、gdb、binutils，cmake2. 配置c...

2020-03-22 22:48:04 825

转载【深度学习框架】win10编译darknet

参考：https://blog.csdn.net/qq_31290747/article/details/80800415注意：用Cygwin中的gcc，最好不要用MinGW，我前面用MinGW编译出现了各种问题1. 安装Cygwin安装 Cygwin的时候，要安装make，binutils 、 gcc 、 gcc-mingw 、 gdb给Cygwin配置环境变量2. 编译darkn...

2020-03-22 11:55:51 806

转载【目标检测】centernet嵌入式网络优化

原文：https://mp.weixin.qq.com/s/PrkID3lnoDFVUxh-i3V2UQ这是来自腾讯的一篇解读，针对嵌入式设备，从目标检测模型方面进行优化。二、选型近几年物体检测算法日新月异，面对琳琅满目的检测模型（见图 1），合适的才是最好的。（1）One-stage从模型的层次结构上，可分为两阶段（two-stage）和单阶段（one-stage）。（a）Two-...

2020-03-21 12:39:27 6085 4

转载【口罩人脸检测/识别】中科视拓免费开放口罩人脸检测与识别技术解读

原文:中科视拓免费开放口罩人脸检测与识别技术思路通过掺入了20%以上戴口罩的人脸识别数据集训练专门戴口罩识别模型，然后调整整个识别的Pipeline为先检测是否戴口罩，如果判断为带口罩则使用戴口罩的识别模型进行识别，否则使用常规识别模型进行识别。如下图示例：所以整个流程：retinaface检测+分类+关键点根据分类结果选择识别模型（戴口罩/未戴口罩）SDK部署TenniS应该...

2020-03-20 09:23:32 1143

原创【文字风格】SwapText: Image Based Texts Transfer in Scenes论文阅读

来源:阿里巴巴code:未开源摘要：在保留原始字体、颜色、大小和背景纹理的同时，在场景图像中交换文本是一项具有挑战性的任务，因为不同的因素之间存在复杂的相互作用。在这项工作中，我们提出了SwapText，一个三个阶段的框架来转移文本的场景图像。首先，提出了一种新的文本交换网络来代替前景图像中的文本标签。其次，学习背景补全网络来重建背景图像。最后，利用所生成的前景图像和背景图像，通过融合网络...

2020-03-20 08:59:31 1864

转载【C++】vs2015编译opencv249，win10

原文：https://blog.csdn.net/Lee_Dk/article/details/80466523打开CMake，设置源文件路径，和生成路径，第一步我新建的build和buildwin32 我之前用过了，所以这里我另外建了一个文件夹 test来演示。然后点击Configure，会出现编译器的选项，Visual studio 14 2015生成win32的解决方案，Vis...

2020-03-19 11:02:22 312

原创【人像分割】随读

1. 视频人像分割参考自：https://zhuanlan.zhihu.com/p/48080465视频人像分割可以看成是一个特殊的Semantic Segmentation任务，他需要把视频中每帧图像的每一个像素点都打上一个类别标签。和典型的Semantic Segmentation任务有两个较大的差异：1.类别只有两个（人像和背景） 2.视频中人物的移动是连续的，通常几个连续帧之间人像的M...

2020-03-19 08:59:07 805

原创【日常工作】Linux_x64宏软人脸识别sdk调试记录

typedef的使用typedef struct OLNode{　　int i,j;　　int data;　　OLNode *right,*down;}OLNode,*OLink;//结构的对象OLNode, 指向结构的指针*OLink,可以这样写struct OLNode{};OLNode OLNode, *OLink;/////传递结构的指针- 调用函数时，将结构的...

2020-03-11 21:21:18 426

原创【人脸检测】libfacedetection项目解读（二）

将pytorch训练好的模型转cpp1. 载入预训练的模型和使用pytorch一样，载入预训练的模型，并将模型设置为“eval”模式。codenet = YuFaceDetectNet(phase='test', size=None ) # initialize detectornet = load_model(net, args.trained_model, True)net....

2020-03-08 13:24:59 1198

原创【人脸检测】libfacedetection.train项目解读记录

目的：为什么libfacedetetiong可以脱离pytorch/caffe等环境的依赖关于模型的一些训练细节，如：数据，模型，如何脱离pytorch的依赖，只用c++就行，推理的速度等如何在现有的基础上进行拓展，让其支持更多的模型。训练细节1. 模型先上关键代码，无关紧要的就删了：self.model1 = Conv_2layers(3, 32, 16, 2) ...

2020-03-07 23:22:51 1507

转载【C++】关于VS的一些记录

关于VS中的sln文件vcproj是工程文件，sln是解决方案文件。一个解决方案里面可以包含多个工程。VS在解决方案中为什么要添加“头文件”和“源文件”？VS的项目和解决方案的解释https://www.jianshu.com/p/c3d909bb27c2visual C++ 项目和解决方案的区别学习C++学的是什么？转载自：https://www.cnblogs.com/ro...

2020-03-05 20:27:44 310 1

转载【opencv】二进制数据转opencv图片

转载自:https://blog.csdn.net/loovelj/article/details/81224992直接写入图片 with open('./test.jpg', 'wb') as f: f.write(buffer_data) # buffer_data就是图片的二进制数据转成opencv图片img_np_arr = np....

2020-03-05 16:30:10 1861

原创【C++】byte*数据流转string

我们不讨论与字符集有关的内容，只讨论在字节流传递过程中的问题。我们在做一系统操作时会需要使用到数据流，比如接收网络数据，文件数据，图片数据，原始数据大多是以byte数组的形式提供，与其它语言(c#，java)交互时也是如此。c++中byte数组是不能传递的，byte指针倒是可以传递，但我一直拿不到正确的长度(或许只是我没找对方法)。我在网上也很少能找到string转byte[]或byte[]转...

2020-03-05 09:39:27 5852

原创【模型测试】ASSF融合方式测试

参考博客：https://blog.csdn.net/watermelon1123/article/details/103277773ASFF特征融合方式具有很好的效果。这里以centerface在wider face数据集上做测试。发现该策略并没有可复制性的适用性# mobilev2_assfEasy Val AP: 0.8727267930686036Medium Val AP: ...

2020-03-03 09:17:46 1456

原创【目标检测】提升目标检测的技巧

Bag of Freebies for Training Object Detection Neural Networks摘要：提高深度学习模型精度主要有以下一些方面：1. 更好的模型如vgg-resnet-densenet；2. 更多的数据；3. 更好的tricks。这篇文章主要从tricks方面入手来讨论一些tricks对模型的提高。而且，深度学习有一些技巧是针对特定的模型才有提升作用...

2020-03-03 01:12:41 2319

hisi3516dv300, 用IVE将yuv420数据转换成bgr，包含源代码和测试数据

hisi3516dv300, 用IVE将yuv420数据转换成bgr，包含源代码和测试数据。

2022-12-07

armv7白皮书:ARM Architecture Reference Manual ARMv7-A and ARMv7-R edition

armv7白皮书，包含指令集等

2021-04-07

armv8的白皮书:Arm Architecture Reference Manual Armv8, for Armv8-A architecture

armv8的白皮书，为官方文档包含架构讲解，neon函数，指令集等。文件为百度网盘下载链接。

2021-04-07

download_scannet.zip

scannet数据下载的python脚本。

2021-01-27

pybind11 python调用c++拓展的例子

采用pybind11模块来实现python调用c++程序的两个例子，具体可以看：文章：https://blog.csdn.net/u011622208/article/details/111302047

2020-12-16

tensorrt5.1双线性上采样插件

针对tensorrt5.1实现的双线性上采样插件，插件实测无误。如果用nvidia的gpu，在推理的时候，采用tensorrt进行加速是一个很好的选择，虽然tensorrt没有开源。

2020-11-17

opencv_cuda.tar.gz

利用cuda加速opencv图像处理的例子——交换mat的r，b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速，使用过程需要管理CPU与GPU之间的数据传输，内核函数调用参数的设置，内核函数的优化等。优点是处理过程受控于用户，用户可以实现更多的并行加速处理操作。

2020-11-10

cuda向量加法cmake编译

采用cmake编译cuda向量加法。　在大量的C/C++的项目中都使用CMake来进行项目的管理，而CUDA又是很流行的并行计算库，利用CMake来构建CUDA项目就显得很有必要了，而且项目中使用的CMakeLists.txt基本框架一致。

2020-11-10

AMD-APP-SDK-v2.8-Windows-64.exe的安装文件

64位windows amd平台的opencl安装软件。安装之后sample在：C:\Users\xx\Documents\AMD APP\

2020-08-28

faiss_install.zip

Faiss是Facebook AI团队开源的针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意：编译器不同，可能无法使用。

2020-08-06

Hi3519A编译好的YOLOV3 demo百度网盘下载链接

Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的，这就让人很不开心，而且华为的人给的资料很乱，其次，很多的demo都是支持Hi3559A的，还没入坑的，推荐选Hi3559A进行开发。

2020-04-28

python多文件夹/文件夹依赖关系制作pip安装包

将文件夹打包成pip安装包，网络上大多是单个文件夹，且不存在文件（同文件夹/不同文件夹）直接的相互调用。使用环境有限。该包尝试将多个文件夹/文件之间存在相互调用的项目打包成一个pip包。

2020-02-27

ocr_annotation-master.zip

采用python-flask框架开发图像标注工具,主要思路是在标注的过程中先调用百度/阿里等免费的api进行标注，并进行人工的验证或目标矩形框的修正，同时支持单张图片多个目标的标注。整理想法很简单，但是实现起来还是很麻烦的。大概用了2周的时间（而且是在开源项目上修改来的）

2020-01-07

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification.pdf

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification的论文pdf

2019-08-02

pig_coco.py

我们一般使用的数据格式是voc2007的数据格式，有时我们也需要用coco数据格式，这种格式一般以json格式存储，那么如将voc2007格式的数据转成coco数据格式呢？这是python的代码实现，只用改路径就好。

2019-07-03

支持向量机线性可分matlab程序

采用matlab自带的quadprog（）函数对支持向量机模型进行求解。整个文件夹包含测试用数据集，可运行。

2018-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人