嵌入式深度学习
文章平均质量分 76
汇总自己嵌入式端深度学习相关的博文。包括但不限于神经网络加速的理论和软件,以及移动端的深度学习芯片等硬件。
yuanlulu
做过嵌入式Linux开发、深度学习平台开发。擅长c++和python。
展开
-
rknn-tookit使用笔记
记录一下最新使用rknntookit转换模型遇到的问题原创 2022-07-25 22:39:15 · 1611 阅读 · 0 评论 -
rknn(rknpu)使用笔记
最近使用rknpu做了一些工作,这里记录下自己遇到的一些问题,希望对其他人有帮助,原创 2022-07-18 22:28:17 · 8341 阅读 · 0 评论 -
rk3399上opencv使用gstreamer访问mipi摄像头
环境硬件:友善之臂NanoPC T4rk3399:Big.Little 架构:双核Cortex-A72 + 四核 Cortex-A53 架构,64位CPU主频超过1.8GHz软件:rk3399-eflasher-friendlydesktop-bionic-4.4-arm64-20181219.img这是友善之臂定制的一个基于ubuntu18.04的64位操作系统。探索思路自己...原创 2019-03-30 19:35:46 · 11696 阅读 · 9 评论 -
rk3399+ubuntu:基于深度学习框架ncnn对比clang和gcc性能
编译方式修改toolchains/aarch64-linux-gnu.toolchain.cmake,内容如下:# set cross-compiled system type, it's better not use the type which cmake cannot recognized.SET ( CMAKE_SYSTEM_NAME Linux )SET ( CMAKE_SYST...原创 2019-02-26 22:09:05 · 5350 阅读 · 8 评论 -
rk3399环境配置:安装opencv、dlib和tensorflow,并测试ncnn性能
概述最近入手了NanoPC-T4开发板,上面用的是rk3399这款芯片。安装系统:rk3399-eflasher-friendlydesktop-bionic-4.4-arm64-20181219。这是一个ubuntu18.04为基础的Linux系统。安装过程下面的操作都是在root用户下完成的。更新源到/etc/apt/sources.list.替换url为http://mirror...原创 2019-02-24 12:57:03 · 8365 阅读 · 9 评论 -
Facebook开源高性能内核库QNNPACK_笔记
PDOT简介卷积可以分解成一种名为 im2col 的内存布局转换和矩阵相乘的组合。因此,卷积神经网络中的有效推理问题很大程度上可以看做矩阵乘法的有效实现问题——在线性代数库中也称为 GEMM。当前的处理器上,这一实现会受到内存和缓存带宽,而不是乘-加单元计算力的限制。但一个小小的修改——同时计算几行 A 和几行 B 的点积——却使得性能大大提升。修改后的基元加载 A 的 MR 及 B 的 ...原创 2019-01-24 16:00:51 · 1379 阅读 · 0 评论 -
英特尔OpenVINO深度学习框架--ubuntu16.04上的安装手记
概述OpenVINO是intel的深度学习工具框架,本质是一个支持intel各种硬件(CPU、集显、FPGA和Movidius VPU)的推理机。这个工具本身不做训练,但是可以把其它深度学习框架(如 Caffe, TensorFlow, MXNet)训练的模型文件转化为自己支持的格式。所以OpenVINO分为两部分(github上源码也分为这么两个目录):Inference Engine...原创 2019-01-23 23:06:19 · 9617 阅读 · 2 评论 -
MTCNN人脸及特征点检测--基于树莓派3B+及ncnn架构
概述本文尝试在树莓派3B+上用ncnn框架测试MTCNN。ncnn的基本编译和使用请参考《在树莓派3B+上编译ncnn并用benchmark和mobilenet_yolo测试》。本文在这个博客基础上进行操作。操作步骤下载mtcnn从mtcn-ncnn项目中下载mtcnn子目录,把这个目录放在最新的ncnn源码目录下添加对mtcnn的支持修改ncnn最顶层的CMakeList.txt,...原创 2019-01-15 20:39:23 · 8260 阅读 · 10 评论 -
树莓派上为python装tensorflow和opencv
环境树莓派3B+, python3.5,官方系统准备sudo apt updatesudo apt install python3-dev python3-pipsudo apt install libatlas-base-dev # required for numpy安装opencvpip3 install opencv-python==3.3.0.10# t...原创 2019-01-04 19:19:44 · 2761 阅读 · 4 评论 -
在树莓派3B+上编译ncnn并用benchmark和mobilenet_yolo测试
步骤安装git和cmake$ sudo apt-get install git$ sudo apt-get install cmake安装protocobuf和其它依赖项这段命令参考自《树莓派3B完成ncnn框架测试》sudo apt-get install -y gfortransudo apt-get install -y libprotobuf-dev libleveldb-...原创 2019-01-09 18:07:44 · 5908 阅读 · 8 评论 -
ARM64+ubuntu18.04深度学习环境安装小结
概述本人断断续续花费了两周时间,在某国产ARM64+linux环境的服务器上,使用docker容器安装成功了公司深度学习项目所需的环境。中间过程坎坷,在此结文以记,希望能对他人有所帮助,少踩坑。目前成功搭建的环境如下:aarch64 docker容器,ubuntu18.04, python2, opencv3.3, dlib19.15, tensorflow1.5, sklearn。上...原创 2018-08-12 15:59:53 · 14473 阅读 · 1 评论 -
在树莓派上安装tensorflow最新版本
昨天刚看了一篇文章,《树莓派+Movidius NCS神经计算棒》,作者认可了树莓派加Movidius NCS神经计算棒的组合效果,但同时也指出这种组合的缺点在于性能略低,且树莓派版本的ubuntu没法安装最新版本的tensorflow(作者只看到支持tf1.1)。对于树莓派性能低没什么可说的,毕竟硬件参数在那,可是经过搜索,树莓派上安装高版本的tensorflow已经不再是问题。首先,维护树...原创 2018-05-23 13:48:35 · 6326 阅读 · 1 评论 -
移动端深度学习框架小结
1. 起因昨天看到小米开源了深度学习框架MACE(https://github.com/XiaoMi/mace) 看到它有几个特点:异构加速、汇编级优化、支持各种框架的模型转换。整体来看,料很足,特别是异构的支持,非常有诚意。 有了异构,就可以在CPU、GPU和DSP上跑不同的模型,实现真正的生产部署,比如人脸检测、人脸识别和人脸跟踪,可以同时跑在不同的硬件上。小米支持的GPU不限于高...原创 2018-06-29 15:13:46 · 11271 阅读 · 4 评论