Adlik Deer版本发布，模型推理加速就靠它啦

最新推荐文章于 2024-10-07 06:31:57 发布

Linux基金会AI&Data基金会

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量216

点赞数

文章标签：人工智能 java 深度学习大数据 python

原文链接：https://mp.weixin.qq.com/s?__biz=MzA3NjUzODYzOQ==&mid=2247484533&idx=1&sn=360425b282c840bd24e09ad1edd8abc0&chksm=9f5ef215a8297b033b46617a7c5af03a3e94629fffaf1b367800dc8a3e0dcb66fa9125eb8fa4&scene=126&&sessionid=0

版权

今天，Adlik Deer版本(V0.4.0)发布啦！

本次的新版本中，可以看到Adlik最近一段时间的许多技术探索，对优化器来说有集成蒸馏、Zen-NAS优化等；推理引擎也更易用、支持更多硬件和推理运行时。针对Bert的模型推理优化，Adlik使用Ansor来搜索全局最优的张量调度方案，为动态输入的推理提供了专用调度器，在x86 CPU上能达到比OpenVINO更高的吞吐量。

欢迎大家体验试用新版本哦，用Adlik实现模型推理性能的飞跃。

Compiler

Adlik编译器支持OpenVINO INT8量化
Adlik编译器支持TensorRT INT8量化，支持扩展量化校准器，降低引入量化带来的精度下降

Optimizer

支持集成蒸馏方式，使用多教师网络进行蒸馏优化
支持ZEN-NAS搜索增强特性，包括并行训练，搜索加速优化，修复原有实现bug等，在搜索时间下降15%左右情况下，搜索Score略有提升，搜索到的模型训练精度提升0.2%~1%

Inference Engine

支持Paddle Inference Runtime，使用Paddle模型时无需再通过Onnx组件转换，直接可以在Adlik环境上运行推理。
支持Intel TGL-U i5 设备推理，完成多模型支持验证，提交Benchmark
云原生镜像发布0.4版本，支持引擎各组件最新版本：
(1) OpenVINO：2021.4.582版本
(2) TensorFlow：2.6.2
(3) TensorRT：7.2.1.6
(4) Tf-lite：2.4.0
(5) TVM：0.7
(6) Paddle Inference：2.1.2
新增C++版本Client API，支持cmake和bazel方式编译，方便用户在C/C++场景应用部署。

Benchmark Test

在Intel TGL-U i5 设备完成Resnet-50，Yolo v3/v4，FastRCNN，MaskRCNN等模型Benchmark测试，包括时延，吞吐量，以及GPU/CPU视频解码下的各种性能指标。

Adlik等你来关注！

Adlik Github

Adlik交流群

Linux基金会AI&Data基金会

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Linux基金会AI&Data基金会 CSDN认证博客专家 CSDN认证企业博客

码龄4年

46: 原创

-: 周排名

27万+: 总排名

10万+: 访问

: 等级

605: 积分

73: 粉丝

101: 获赞

8: 评论

435: 收藏

私信

关注

热门文章

分类专栏

最新评论

vLLM 实战
小军军军军军军: vllm要依靠停止符
vLLM 实战
cooper6666: 感谢分享，我这边有个小疑问，max_tokens=16生成的结果不是非常的短吗？不能满足真是的业务情况。而且，我这边将max_tokens设置成512，但是生成的结果非常的扩散，答非所问，请问这是什么原因了？
通用视觉大模型综述
sinat_38034171: 本人才疏学浅，几个大厂的CV 大模型都是迁移学习吗，还是我理解错了
训练后量化(PTQ) 工作流理解
Benjamin Liang: 您好，你这篇文章有部分内容（包括若干图片文字等）来自高通的量化白皮书，如果可以请您补充参考文献中
大模型推理性能优化之KV Cache解读
Youther1898: Adlik有支持int8的大模型的推理吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。