自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (15)
  • 收藏
  • 关注

原创 【论文阅读】CentripetalNet:目标检测新网络,COCO 48 % AP超现所有Anchor-free网络

转载自:https://mp.weixin.qq.com/s/rpqDpXJA2OBHhGjkBUDPXQ尊重原创,请读原文论文:代码:关键词: anchor-free, coco48%

2020-03-31 23:37:28 743

转载 【opencv】树莓派安装opencv

转载自:https://www.jianshu.com/p/56929416b4a1

2020-03-31 13:21:51 290

原创 【ncnn】源码阅读理解(二)——layer层

可以参考:https://blog.csdn.net/sinat_31425585/article/details/100586033这里是根据配置文件,创建相关的layer,就是定义相关的层,声明内存空间等。这里和darknet差别还是很大的。darknet的源码更容易阅读。ncnn做了几层封装,第一眼看到的时候,肯定是????的。整个流程:第一部分通过类的名字const char* typ...

2020-03-30 22:27:35 958

转载 【C++】C/C++语言的一些技巧

转载自:https://blog.csdn.net/sen_blog/article/details/9665763#include <iostream>//typedef int CCLayer;class CCLayer{};class ActionManual:public CCLayer{public: ActionManual() {...

2020-03-30 14:56:12 426

原创 【ncnn】源码阅读理解(一)——例子注释

Code#include <opencv2\opencv.hpp>#include <map>#include <vector> #include <algorithm> #include <functional> #include <cstdlib> #include <iostream>#...

2020-03-29 12:54:07 1278

转载 【C++】pair及pair在vector中的使用

转载自:https://blog.csdn.net/qq_35962520/article/details/816288521. pair1.1 定义(构造):pair<int ,double> p1;//默认构造函数pair<int ,double> p2(1, 2.4);//用给定值初始化pair<int ,double> p3(p2);//拷贝构...

2020-03-29 12:31:22 2410

原创 【ncnn】win10 vs2015编译ncnn项目

1. 编译protobuf这是google开源的一个项目,ncnn用来序列保存网络模型的。1.1 下载protobuf,从这个博客1.2 编译protobuf看网络上的文章,这里有两种方式可以编译protobuf。采用cmake-gui采用vs2015命令行因为编译opencv的时候用的cmake-gui,这里用vs命令行试一下。参考:https://blog.csdn.net...

2020-03-29 00:35:20 2226 4

原创 【darknet】源码阅读理解(六)——maxpool的前向传播/反向传播

maxpool是用于数据特征降维,减少CNN网络的计算量,是CNN的基础组件之一。1. 前向传播前向传播就是在channel通道上,对一定size*size的正方形区域求出最大值,作为下一层layer的输入。同时,为了反向误差的传播需要保存最大值所对应的索引indexCodevoid forward_maxpool_layer(const maxpool_layer l, network...

2020-03-28 20:37:42 784

原创 【darknet】阅读理解(5)——batchnorm和activation

1. batchnorm1.1 原理大致的原理可以参考:https://blog.csdn.net/qq_25737169/article/details/79048516如果了解个大概的话,就是:(x-均值)/ 偏差 * 缩放系数 + 一个偏置1.2 darknet实现说明:darknet cpu采用C实现的,能更有助于原理的理解或者也可以用numpy等高级框架实现总之,...

2020-03-28 12:41:36 591

原创 【darknet】源码阅读理解(三)——CNN前向传播

这里以Code,原理相结合的方式1. darknet中CNN关键代码1. int m = l.n/l.groups; // 输出通道 int k = l.size*l.size*l.c/l.groups; // img2col后图像矩阵的行数 int n = l.out_w*l...

2020-03-27 18:48:00 831

原创 【树莓派】树莓派4B无法运行64位程序

问题: 在linux_x64上动态链接库无法在树莓派4B上运行尝试一官方推出了,检查boot目录下是否有kernel8.img如果没有就 rpi-update然后添加arm_64bit=1到config.txt执行uname -a 你会看到内核从v7l(armhf)变v8(arm64)了结果: 还是不行,getconf LONG_BIT 还是32尝试二:安装一个64位的系统。。。...

2020-03-27 17:57:10 2324 1

转载 【darknet】源码阅读理解(四)——#pragma omp parallel for

参考自:https://www.cnblogs.com/qinguoyi/p/7251305.html出处: darknet在cpu上进行CNN计算时。Code:void gemm_nn(int M, int N, int K, float ALPHA, float *A, int lda, float *B, int ldb, float...

2020-03-27 17:01:56 617

原创 【darknet】解读(二)——预训练模型加载

。。。。

2020-03-26 22:48:09 634

原创 【基础工具】树莓派文件管理器闪退

sudo apt-get install --reinstall pcmanfm

2020-03-26 18:44:54 1277

原创 【darknet】解读(一)

layer filters size input output 0 conv 32 3 x 3 / 1 608 x 608 x 3 -> 608 x 608 x 32 0.639 BFLOPs 1 conv 64 3 x 3 / 2 608 x 608 x 32...

2020-03-26 00:12:24 456

原创 【文字识别】UnrealText: Synthesizing Realistic Scene Text Images from the Unreal World论文阅读

类别: 文本合成来源: CVPR2020,旷视code: https://jyouhou.github.io/UnrealText/摘要: 合成数据是训练场景文本检测和识别模型的关键工具。一方面,在场景文本识别器的训练中,合成词图像已被证明是真实图像的成功替代品。然而,另一方面,场景文本检测器仍然严重依赖于大量手工注释的真实世界图像,这是非常昂贵的。在本文中,我们介绍了一种有效的图像合成方法...

2020-03-25 09:07:34 1467

原创 【人脸检测】ubuntu16.04编译libfacedetection

参考自:https://blog.csdn.net/qq_36470920/article/details/887151351. 修改cmakelist.txt打开cmake的demo编译选项option(DEMO "build the demo" ON)2. 编译mkdir buildcd buildcmake ..make3. 测试cd build./detect...

2020-03-24 11:15:06 676 4

原创 【darknet】win10 vscode单步调试darknet配置

参考自:https://www.cnblogs.com/ranjiewen/p/10214728.html,https://blog.csdn.net/xxmhnu/article/details/802800061. 安装vscode2. 编译darknet将darknet中makefile的CC=gcc改为 CC=gcc -g参考:https://blog.csdn.net/u0...

2020-03-24 00:09:03 1384

原创 【C++】SeetaFace2在Windows10 VS2015编译调试

参考:https://blog.csdn.net/sinat_33896833/article/details/1001835811. 下载seetaface源代码git clone https://github.com/seetafaceengine/SeetaFace2.git2. 用cmake.gui编译在seetaface2根目录下新建一个build文件夹选择CMakeLis...

2020-03-23 15:04:09 803 3

原创 【基础工具】win10 clion配置cygwin

可参考:https://blog.csdn.net/qq_36819130/article/details/78668249但是我前面已经安装了MinGW,我的流程是:先卸载Mingw删除“环境变量”再装Cygwin将Cygmin/bin加入到环境变量配置clion安装的时候主要要选择gcc-core、gcc-g++、make、gdb、binutils,cmake2. 配置c...

2020-03-22 22:48:04 825

转载 【深度学习框架】win10编译darknet

参考:https://blog.csdn.net/qq_31290747/article/details/80800415注意:用Cygwin中的gcc,最好不要用MinGW,我前面用MinGW编译出现了各种问题1. 安装Cygwin安装 Cygwin的时候,要安装make,binutils 、 gcc 、 gcc-mingw 、 gdb给Cygwin配置环境变量2. 编译darkn...

2020-03-22 11:55:51 806

转载 【目标检测】centernet嵌入式网络优化

原文:https://mp.weixin.qq.com/s/PrkID3lnoDFVUxh-i3V2UQ这是来自腾讯的一篇解读,针对嵌入式设备,从目标检测模型方面进行优化。二、选型近几年物体检测算法日新月异,面对琳琅满目的检测模型(见图 1),合适的才是最好的。(1)One-stage从模型的层次结构上,可分为两阶段(two-stage)和单阶段(one-stage)。(a)Two-...

2020-03-21 12:39:27 6085 4

转载 【口罩人脸检测/识别】中科视拓免费开放口罩人脸检测与识别技术解读

原文:中科视拓免费开放口罩人脸检测与识别技术思路通过掺入了20%以上戴口罩的人脸识别数据集训练专门戴口罩识别模型,然后调整整个识别的Pipeline为先检测是否戴口罩,如果判断为带口罩则使用戴口罩的识别模型进行识别,否则使用常规识别模型进行识别。如下图示例:所以整个流程:retinaface检测+分类+关键点根据分类结果选择识别模型(戴口罩/未戴口罩)SDK部署TenniS应该...

2020-03-20 09:23:32 1143

原创 【文字风格】SwapText: Image Based Texts Transfer in Scenes论文阅读

来源:阿里巴巴code:未开源摘要: 在保留原始字体、颜色、大小和背景纹理的同时,在场景图像中交换文本是一项具有挑战性的任务,因为不同的因素之间存在复杂的相互作用。在这项工作中,我们提出了SwapText,一个三个阶段的框架来转移文本的场景图像。首先,提出了一种新的文本交换网络来代替前景图像中的文本标签。其次,学习背景补全网络来重建背景图像。最后,利用所生成的前景图像和背景图像,通过融合网络...

2020-03-20 08:59:31 1864

转载 【C++】vs2015编译opencv249,win10

原文:https://blog.csdn.net/Lee_Dk/article/details/80466523打开CMake,设置源文件路径,和生成路径,第一步我新建的build和buildwin32 我之前用过了,所以这里我另外建了一个文件夹 test来演示。然后点击Configure,会出现编译器的选项,Visual studio 14 2015生成win32的解决方案,Vis...

2020-03-19 11:02:22 312

原创 【人像分割】随读

1. 视频人像分割参考自:https://zhuanlan.zhihu.com/p/48080465视频人像分割可以看成是一个特殊的Semantic Segmentation任务,他需要把视频中每帧图像的每一个像素点都打上一个类别标签。和典型的Semantic Segmentation任务有两个较大的差异:1.类别只有两个(人像和背景) 2.视频中人物的移动是连续的,通常几个连续帧之间人像的M...

2020-03-19 08:59:07 805

原创 【日常工作】Linux_x64宏软人脸识别sdk调试记录

typedef的使用typedef struct OLNode{  int i,j;  int data;  OLNode *right,*down;}OLNode,*OLink;//结构的对象OLNode, 指向结构的指针*OLink,可以这样写struct OLNode{};OLNode OLNode, *OLink;/////传递结构的指针- 调用函数时,将结构的...

2020-03-11 21:21:18 426

原创 【人脸检测】libfacedetection项目解读(二)

将pytorch训练好的模型转cpp1. 载入预训练的模型和使用pytorch一样,载入预训练的模型,并将模型设置为“eval”模式。codenet = YuFaceDetectNet(phase='test', size=None ) # initialize detectornet = load_model(net, args.trained_model, True)net....

2020-03-08 13:24:59 1198

原创 【人脸检测】libfacedetection.train项目解读记录

目的:为什么libfacedetetiong可以脱离pytorch/caffe等环境的依赖关于模型的一些训练细节,如:数据,模型,如何脱离pytorch的依赖,只用c++就行,推理的速度等如何在现有的基础上进行拓展,让其支持更多的模型。训练细节1. 模型先上关键代码,无关紧要的就删了:self.model1 = Conv_2layers(3, 32, 16, 2) ...

2020-03-07 23:22:51 1507

转载 【C++】关于VS的一些记录

关于VS中的sln文件vcproj是工程文件,sln是解决方案文件。一个解决方案里面可以包含多个工程。VS在解决方案中为什么要添加“头文件”和“源文件”?VS的项目和解决方案的解释https://www.jianshu.com/p/c3d909bb27c2visual C++ 项目和解决方案的区别学习C++学的是什么?转载自:https://www.cnblogs.com/ro...

2020-03-05 20:27:44 310 1

转载 【opencv】二进制数据转opencv图片

转载自:https://blog.csdn.net/loovelj/article/details/81224992直接写入图片 with open('./test.jpg', 'wb') as f: f.write(buffer_data) # buffer_data就是图片的二进制数据转成opencv图片img_np_arr = np....

2020-03-05 16:30:10 1861

原创 【C++】byte*数据流转string

我们不讨论与字符集有关的内容,只讨论在字节流传递过程中的问题。我们在做一系统操作时会需要使用到数据流,比如接收网络数据,文件数据,图片数据,原始数据大多是以byte数组的形式提供,与其它语言(c#,java)交互时也是如此。c++中byte数组是不能传递的,byte指针倒是可以传递,但我一直拿不到正确的长度(或许只是我没找对方法)。我在网上也很少能找到string转byte[]或byte[]转...

2020-03-05 09:39:27 5852

原创 【模型测试】ASSF融合方式测试

参考博客:https://blog.csdn.net/watermelon1123/article/details/103277773ASFF特征融合方式具有很好的效果。这里以centerface在wider face数据集上做测试。发现该策略并没有可复制性的适用性# mobilev2_assfEasy Val AP: 0.8727267930686036Medium Val AP: ...

2020-03-03 09:17:46 1456

原创 【目标检测】提升目标检测的技巧

Bag of Freebies for Training Object Detection Neural Networks摘要: 提高深度学习模型精度主要有以下一些方面:1. 更好的模型如vgg-resnet-densenet;2. 更多的数据;3. 更好的tricks。这篇文章主要从tricks方面入手来讨论一些tricks对模型的提高。而且,深度学习有一些技巧是针对特定的模型才有提升作用...

2020-03-03 01:12:41 2319

hisi3516dv300, 用IVE将yuv420数据转换成bgr,包含源代码和测试数据

hisi3516dv300, 用IVE将yuv420数据转换成bgr,包含源代码和测试数据。

2022-12-07

armv7白皮书:ARM Architecture Reference Manual ARMv7-A and ARMv7-R edition

armv7白皮书,包含指令集等

2021-04-07

armv8的白皮书:Arm Architecture Reference Manual Armv8, for Armv8-A architecture

armv8的白皮书,为官方文档包含架构讲解,neon函数,指令集等。文件为百度网盘下载链接。

2021-04-07

download_scannet.zip

scannet数据下载的python脚本。

2021-01-27

pybind11 python调用c++拓展的例子

采用pybind11模块来实现python调用c++程序的两个例子,具体可以看:文章:https://blog.csdn.net/u011622208/article/details/111302047

2020-12-16

tensorrt5.1双线性上采样插件

针对tensorrt5.1实现的双线性上采样插件,插件实测无误。如果用nvidia的gpu,在推理的时候,采用tensorrt进行加速是一个很好的选择,虽然tensorrt没有开源。

2020-11-17

opencv_cuda.tar.gz

利用cuda加速opencv图像处理的例子——交换mat的r,b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速,使用过程需要管理CPU与GPU之间的数据传输,内核函数调用参数的设置,内核函数的优化等。优点是处理过程受控于用户,用户可以实现更多的并行加速处理操作。

2020-11-10

cuda向量加法cmake编译

采用cmake编译cuda向量加法。 在大量的C/C++的项目中都使用CMake来进行项目的管理,而CUDA又是很流行的并行计算库,利用CMake来构建CUDA项目就显得很有必要了,而且项目中使用的CMakeLists.txt基本框架一致。

2020-11-10

AMD-APP-SDK-v2.8-Windows-64.exe的安装文件

64位windows amd平台的opencl安装软件。安装之后sample在:C:\Users\xx\Documents\AMD APP\

2020-08-28

faiss_install.zip

Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意:编译器不同,可能无法使用。

2020-08-06

Hi3519A编译好的YOLOV3 demo百度网盘下载链接

Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的,这就让人很不开心,而且华为的人给的资料很乱,其次,很多的demo都是支持Hi3559A的,还没入坑的,推荐选Hi3559A进行开发。

2020-04-28

python多文件夹/文件夹依赖关系制作pip安装包

将文件夹打包成pip安装包,网络上大多是单个文件夹,且不存在文件(同文件夹/不同文件夹)直接的相互调用。使用环境有限。该包尝试将多个文件夹/文件之间存在相互调用的项目打包成一个pip包。

2020-02-27

ocr_annotation-master.zip

采用python-flask框架开发图像标注工具,主要思路是在标注的过程中先调用百度/阿里等免费的api进行标注,并进行人工的验证或目标矩形框的修正,同时支持单张图片多个目标的标注。整理想法很简单,但是实现起来还是很麻烦的。大概用了2周的时间(而且是在开源项目上修改来的)

2020-01-07

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification.pdf

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification的论文pdf

2019-08-02

pig_coco.py

我们一般使用的数据格式是voc2007的数据格式,有时我们也需要用coco数据格式,这种格式一般以json格式存储,那么如将voc2007格式的数据转成coco数据格式呢?这是python的代码实现,只用改路径就好。

2019-07-03

支持向量机线性可分matlab程序

采用matlab自带的quadprog()函数对支持向量机模型进行求解。整个文件夹包含测试用数据集,可运行。

2018-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除