君正Magik算法平台介绍

最新推荐文章于 2024-01-24 11:56:13 发布

二haha

最新推荐文章于 2024-01-24 11:56:13 发布

阅读量4.1k

点赞数 1

分类专栏：文章文章标签：深度学习嵌入式硬件

原文链接：https://www.bilibili.com/video/BV1nw41197yZ?spm_id_from=333.337.search-card.all.click&vd_source=7b615a1a0f306117d0c9605deb1b2472

版权

文章专栏收录该内容

4 篇文章 4 订阅

订阅专栏

------------摘自君正官方《magik_introduce》

00 引言

君正简介，芯片 + AI 算力 + AI 开发平台」方案落地，公布全栈式低功耗 AI 技术

01 Magik概述

Magik是一个为端侧AI应用场景打造的集模型训练、优化转换、部署推理于一体的全栈式深度学习开放平台。

支持pytorch/tensorflow/mxnet/caffe/onnx等主流框架。

全栈式，即提供训练工具包，用户可出数据，用其Training Kit训练。

具体：

02 Magik训练量化以及训练后量化

2.1 模型本质上二进制文件。

2.2 量化方式按量化位置分，训练量化(Quantization Aware Training,QAT)、训练后量化(Post-Training Quantization,PTQ )两种。

QAT:训练中模拟量化行为，在训练中用浮点保存定点参数，最后进行推理时采用定点参数。

优点：精度高、可量化至低位宽 (2、4、8)

缺点：时间成本高，需先训练float->8bit->4bit->2bit

对训练经验和显卡要求高

PTQ:对直接训练出的浮点模型进行模型参数量化。

优点：方便，快捷

缺点：目前为保持无损的转化只能量化到8bit

量化方式选择，训练量化可以得到更小的模型参数、更快推理速度。

板子支持性问题：后量化（T40）；训练量化（Txx，Xs1，T40）,eg T30就没得选了，哈哈

2.3 训练量化硬件需求，需GPU

2.4 软件需求

注：magik目前只支持GPU上进行训练量化

编译magik包需要提供如下环境(pytorch为例)：

Environment:
1. pytorch version
2. python version
3. os system
4. cuda and cudnn version
5. gcc version

安装参考步骤：
anaconda安装命令
（以torch 1.5、python3.6、cuda10.2、cudnn7.6、ubuntu为例）
1. conda creat -n python python=3.6
2. pip install torch==1.5.0 torchvision==0.6.0 -i
   http://pypi.douban.com/simple --trusted-host pypi.douban.com
3. pip install magik_trainingkit_torch_150-1.0.2-py3-none-any.why
4. from ingenic_magic_trainingkit.QuantizationTrainingPlugin.python 
   import ops

2.5 训练量化具体内容以及支持算子

内容概述