2021年11月_papaofdoudou

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Linux&Tina&Melis内存布局分析以及linux reserved memory机制

memoryblock.memory, memoryblock.reserved(without no-map)和 memoryblock.reserved with no-map 的关系如下：为了测试memory reserved机制，我们修改devicetree，新增加两个属性分别为without no-map和 with no-map的reserved区域。

2021-11-20 18:45:27 595 1

原创适用于异构芯片(CPU,ASIC,DSP,FPGA,GPU/GPGPU)的软件并行技术

最后，这么多的并行计算方式，各有千秋，犹如八仙过海，各显神通，在哪里可以一睹他们的风采？无疑机器学习领域是其主战场。

2021-11-14 15:44:55 6192 1

原创 NVIDIA-CUDA HPC 编程模型与内存管理初探

主存和现存在PCIE框架下可以做到互相访问，路径归纳如下：三种角色，两种存储，六种路径。1.HBM通过BAR透给了HOST，使HOST可以通过MMU给CPU访问，或者通过IOMMU给设备访问。2.相反，Host Memory并没有类似的BAR机制透给 PCIE设备端，PCIE设备端想要访问 HOST MEMORY必须经过 HOST IOMMU的映射一遍，加上PCIE端的SMMU映射，对于PCIE设备端（GPU）来说，要经过两层IOMMU翻译。所以从HOST端和GPU端看起来不太对称。

2021-11-12 19:37:56 3181

原创 Cuda环境搭建并部署多目标跟踪模型FairMOT推理验证

环境准备1.PC Host Ubuntu 18.04.6,Linux Kernel 5.4，内核版本关系不大，记录下来备查。2.安装基础工具,比如GCC，CMAKE，VIM，GIT等等，工具尽量完备, 如果做不到，遇到问题临时下载也可。3.安装python3发行版，我用的是anaconda发行版，具体版本是 Anaconda3-2020.11-Linux-x86_64.sh下载地址在如下链接，选择对应的版本即可。https://repo.anaco......

2021-11-10 19:42:36 4572 2

原创使用开源工具scancode-toolkit扫描代码license

被扫描的代码不能包含任何形式的压缩包，库文件等等，如果有的化，需要删除，或者用自带的extractcode工具执行递归解压。各类开源协议权责总结。

2021-11-08 13:30:46 2118 1

原创 OCTAVE演示矩阵量化前后的不变性

>> A=rand(3,3)A = 0.6775266 0.7483415 0.4066659 0.2826693 0.1728607 0.5242794 0.1570250 0.0015287 0.7337540>> B=rand(3,3)B = 0.64924 0.28227 0.67906 0.82063 0.72221 0.65143 0.63930 0.61994 0.82828...

2021-11-01 15:34:09 103

原创 OPENCV对图像解码并转制为RGB-NCWH格式

YOLOV3网络吃图格式为416*416 NCWH 三通道的RGB格式图，下面的程序可以将一张JPEG图像转换为对应的格式，基于OPENCV#include <opencv2/opencv.hpp>#include <iostream>#include <vector>#include <unistd.h> using namespace std;using namespace cv; int main(int argc, char **

2021-11-29 23:06:16 3121

原创 libjpeg编译开发

1.获取代码Independent JPEG Group2解压：2编译：dos2unix ./configure对文件进行字符集转换，否则编译不过执行make3. 测试执行make test结束！

2021-11-29 16:36:33 179

原创基于C语言库进行tensor反量化和文本化几例

概要：工作中遇到量化类型和反量化以及数据在二进制和文本形式之间的转换以及持久化操作比较多，核心是字符串类型和数值类型之间的互转，总结记录如下：字符串转数值型字符串转数值型分为两种情况：字符串转整型：头文件：stdlib.h原型：int atoi (const char *);long atol (const char *);long long atoll (const char *);字符串转浮点型：头文件：stdlib.hdouble atof (cons...

2021-11-28 09:38:58 986

原创 PLL中计算目标频率的的M，N分频系数是如何来的？

下图是某款Sunxi平台的时钟树分布图，输入是24MHZ的晶震源，输出则是很多个不同的频点。一般来讲，输出频率和输入频率满足如下的关系：这篇文章讨论这个公式的原理和来历。下图所示的是PLL的基本结构，生成时钟信号的核心部分是压控振荡器(Voltage-Controlled Oscillator, VCO),VCO能够根据所加的电压调整频率的振荡器，从图中可以看到，兼相器可以比较外部输入的基准时钟和VCO自身输入的时钟间的相位差，如果两个时钟一致则维持VCO电压，如果不一致就需要通过控制.

2021-11-20 21:46:23 2638

原创改变图像分辨率的几种方法

发现做深度学习的图像推理的时候，经常会需要对图像做scale操作，这里总结几种常用的方法。1.FFMPEG方法ffmpeg -i dog.jpg -vf scale=416:416 output_416x416.pngffmpeg -i dog.jpg -vf scale=416:416 output_416x416.jpg2.python方法：from PIL import Imageimport osimport sysimport cv2if __name__ =

2021-11-19 18:29:31 6173

原创 Darknet环境安装CUDANN实现推理加速

首先参考下面几篇文章安装darknet,cuda的基础环境:Yolov3网络的物体检测_tugouxp的专栏-CSDN博客1.Get darknet 代码$ git clone https://github.com/pjreddie/darknet$ cd darknet$ makecaozilong@caozilong-Vostro-3268:~/yolo$ git clone https://github.com/pjreddie/darknet正克隆到 'darknet'...remote: En

2021-11-13 19:51:56 387

原创 YOLOV3训练环境的搭建

YOLOV3推理环境搭建参考文章：Yolov3网络的物体检测_tugouxp的专栏-CSDN博客1.Get darknet 代码$ git clone https://github.com/pjreddie/darknet$ cd darknet$ makecaozilong@caozilong-Vostro-3268:~/yolo$ git clone https://github.com/pjreddie/darknet正克隆到 'darknet'...remote: Enumerating obj

2021-11-13 14:59:48 6136

原创 Pytorch线性回归测试

Pytorch开发环境搭建清参考这篇文章：FairMOT Cuda环境搭建并进行推理_tugouxp的专栏-CSDN博客环境准备1.PC Host Ubuntu 18.04.6,Linux Kernel 5.4，内核版本关系不大，记录下来备查。2.安装基础工具,比如GCC，CMAKE，VIM，GIT等等，工具尽量完备, 如果做不到，遇到问题临时下载也可。3.安装python3发行版，我用的是anaconda发行版，具体版本是 Anaconda3-2020.11-Linux-x86_64.sh下载地址在如

2021-11-11 20:47:59 919

原创 mish算子

在看YOLOV4的网络结构的时候遇到了一个之前未曾遇到过的名为MISH的算子，MISH算子在YOLOV4网络中使用非常频繁，值得记录一下。首先看一下原版的darknet yolov3.cfg网络结构：从算子位置上看，它属于每层网络的末端处理，位置上属于激活函数的的范围，事实上它却是也是一个激活函数。经过VIP工具转换后的JSON格式的YOLOV4网络结构如下，可以看到MIST算子被独立了出来：结束！...

2021-11-10 20:14:06 2750

原创转置算子(transpose)的一种实现

上代码：/* * =========================================================================================== * * Filename: transpose.c * * Description: transpose operator impl. * * Version: Melis3.0 * Create: 2021-11-07 14:0

2021-11-07 20:26:13 2148

原创 pytorch yolov3 推理和训练环境搭建

本文基于anaconda python3.8.5环境搭建下载环境首先下载pytorch yolov3的推理和训练开发环境git clone https://github.com/ultralytics/yolov3我们在默认的主分支上耍安装依赖包有几个比较大的包，比如torch，opencv等需要花比较长的时间安装。推理目录中的detect.py执行推理过程，并将结果保存在runs/detect目录下输入命令python detect.py --...

2021-11-06 07:53:20 1413

原创 NCNN转换YOLO4网络并推理

记录基于NCNN的YOLO4网络转换并推理成功的过程。首先按照下面两篇博客的做法安装NCNN和darknet开发环境：腾讯神经网络推理框架NCNN试玩儿_tugouxp的专栏-CSDN博客ncnn 是腾讯开源的神经网络推理框架，官方仓库有详细介绍：https://github.com/Tencent/ncnn.git下面在普通PC的ubuntu18.04环境上搭建环境，运行一把。1.下载代码：git clone https://github.com/Tencent/ncnn.git2.配置环境：cd

2021-11-04 16:10:52 973

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

tugouxp的专栏