AI技术在词典笔上的应用实践

Necther

于 2022-09-02 18:11:49 发布

阅读量1.1k

点赞数 1

分类专栏：自然语言处理文章标签：人工智能

原文链接：https://zhuanlan.zhihu.com/p/493526874

版权

自然语言处理专栏收录该内容

69 篇文章

订阅专栏

本文包括以下几个内容

1.扫描和点查
2.离线翻译
3.高性能端侧机器学习计算库EMLL(Edge ML Library)

扫描和点查
扫描识别
扫描识别和常见的字符识别场景不一样
在这里插入图片描述
一秒钟100张图像

算法需要从快速从拍摄的图像中提取文字
在这里插入图片描述
全景拼接

拼接效果对识别影响很大
在这里插入图片描述
全景拼接

像素级检测：对每个像素位置进行文字和背景分类
中心组行：基于分类结果和位置信息，将扫描的中心文字连接并组合成行
矫正切行：将文本行从复杂的背景中切分出来在这里插入图片描述
复杂的应用场景

• 特殊字体，形近字，背景都会干扰识别
在这里插入图片描述
检测模块+识别模块+纠正模块

超快点查

问题

• 超大广角点查导致广角畸变、光照不均

超快点查

• 根据采集图像预设变换参数

• 将采集图像逆变换得到无畸变图像

• 对阴影进行补偿
在这里插入图片描述

离线翻译

• 离线翻译的需求

• 无网络环境

• 低时延

• 节省带宽

• 隐私

在线翻译模型

• 编码器-解码器架构

• 多个编码器层和解码器层

• 很宽的维度

• 参数量达到上亿规模

在这里插入图片描述

• 神经网络模型存在一定冗余
在这里插入图片描述
• 裁剪模型

• 共享参数

• 量化

• 知识蒸馏

• Lite Transformer

裁剪模型

• 编码器相对更重要

• 更多压缩解码器

• 减少深度的同时减少宽度在这里插入图片描述
共享参数

词向量的共享

在这里插入图片描述

不同层之间的共享
在这里插入图片描述

量化

• 高精度的浮点类型转化为低精度的整型计算
在这里插入图片描述
• 浮点数运算使用量化运算

• 计算量减少，对NPU，DSP芯片友好

• 存储规模减少

• 使用训练感知量化对质量影响也较小

知识蒸馏

• 模型压缩导致质量下降
在这里插入图片描述
• 利用教师模型提升学生模型性能

• 教师模型：大而慢

• 学生模型：小而快
在这里插入图片描述

蒸馏的方法

• Word-level KD

• Sentence-level KD
在这里插入图片描述
高性能端侧机器学习计算库EMLL(Edge ML Library)
端侧AI面临的挑战
• 算力、内存有限

• 功耗限制

• 算法更新

• 多应用部署

端侧AI芯片
端侧AI芯片

• ARM CPU

• 当前端侧AI落地主流平台

• NPU、DSP、GPU

• 受生态环境影响，当前可落地的AI应用较少

• 未来发展趋势

• 端侧AI底层主要耗时计算

• gemm（全连接层、卷积层）

• 扁平矩阵乘

• 第三方blas库gemm针对端侧AI场景下计算性能较差
在这里插入图片描述
EMLL

• EMLL(Edge ML Library)——高性能端侧机器学习计算库

• 为加速端侧AI推理而设计

• 为端侧AI常见的扁平矩阵的计算做了专门的优化

• 支持fp32、fp16、int8等数据类型

• 针对ARM cortex-A7/A35/A53/A55/A76等处理器进行汇编优化

• 支持端侧运行OS：Linux和Android

EMLL优化方法
访存

• 展开外层循环 – 计算/访存比

• 重排元素 – 顺序访存

• 多级分块 – 利用缓存

• 针对扁平矩阵的优化

计算

• SIMD 指令

• 指令顺序

• 指令并发

• 多线程(动态负载)

EMLL功能
• 支持的计算函数

• 支持的架构

• ARMv7a

• ARMv8a

• 支持的端侧OS

• Linux
在这里插入图片描述
EMLL GEMM 性能

离线NMT量化效果

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。