如何打造一个高性能的前端智能推理引擎

最新推荐文章于 2023-09-14 17:01:34 发布

阿里云技术

最新推荐文章于 2023-09-14 17:01:34 发布

阅读量249

点赞数

文章标签：前端 javascript

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43970890/article/details/113681349

版权

什么是前端智能推理引擎在前端智能推理引擎之前，我们先来说一下什么是”端智能”。端智能（On-Device Machine Learning）是指把机器学习的应用放在端侧做。这里的“端侧”，是相对于云服务而言的。它可以是手机，也可以是 IOT 设备等。传统的机器学习，由于模型大小、机器算力的问题，很多是放在服务端做的。比如 Amazon AWS 有“Amazon Rekognition Service”，Google 有 “Google Cloud Vision Service”。而随着以手机为代

摘要由CSDN通过智能技术生成

什么是前端智能推理引擎

在前端智能推理引擎之前，我们先来说一下什么是”端智能”。

端智能（On-Device Machine Learning）是指把机器学习的应用放在端侧做。这里的“端侧”，是相对于云服务而言的。它可以是手机，也可以是 IOT 设备等。

传统的机器学习，由于模型大小、机器算力的问题，很多是放在服务端做的。比如 Amazon AWS 有“Amazon Rekognition Service”，Google 有 “Google Cloud Vision Service”。而随着以手机为代表的端侧设备算力的提高，以及模型设计本身的演进，大小更小、能力更强的模型逐渐能够部署到端上运行。

相比云端部署的方式，APP端拥有更直接的用户特征，同时具备如下优势：

实时性高，端侧处理可节省数据的网络传输时间。
节省资源，充分利用端侧算力和存储空间。
隐私性好，产生数据到消费数据都在端侧完成，避免传输引起的隐私泄露风险。

这些是端智能的优势，但它不是万金油，仍然存在一些局限性：

设备资源有限，端侧算力、存储是有限的，不能做大规模高强度的持续计算。
算法规模小，端侧算力小，而且单用户的数据，在算法上并不能做到最优。
用户数据有限，端侧数据不适合长期存储，同时可用数据有限。

同理，前端智能是指将机器学习的应用放到前端上(web、h5、小程序等).

所以，什么是前端智能推理引擎呢？

如下图：

前端智能推理引擎实际上就是利用前端上算力去执行模型的那个东西。

业界现有的前端推理引擎

这里列出三个常见的推理引擎

tensorflow.js(下面简称为tfjs)
ONNX.js
WebDNN

对于一个端上推理引擎来说，最重要的是什么&#

最低0.47元/天解锁文章

阿里云技术

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
如何打造一个高性能的前端智能推理引擎

什么是前端智能推理引擎在前端智能推理引擎之前，我们先来说一下什么是”端智能”。端智能（On-Device Machine Learning）是指把机器学习的应用放在端侧做。这里的“端侧”，是相对于云服务而言的。它可以是手机，也可以是 IOT 设备等。传统的机器学习，由于模型大小、机器算力的问题，很多是放在服务端做的。比如 Amazon AWS 有“Amazon Rekognition Service”，Google 有 “Google Cloud Vision Service”。而随着以手机为代
复制链接

扫一扫

阿里云技术 CSDN认证博客专家 CSDN认证企业博客

码龄6年

3696: 原创

2万+: 周排名

137万+: 总排名

208万+: 访问

: 等级

4万+: 积分

2642: 粉丝

600: 获赞

283: 评论

3629: 收藏

私信

关注

热门文章

最新评论

基于阿里云 Serverless 容器服务轻松部署企业级 AI 应用
Leckun: 全是要会员收费才能看，怪不得没人看
友邦人寿可观测体系设计与落地
小Tomkk: 这篇文章非常具有启示性和实用性，有空一定根据你的博文写了内容一步一步的试试，感谢博主的分享，期待博主持续带来更多好文
Maxcompute 造数据 - 方法详解
Zi_Q: test.X 轻松模拟你的真实业务场景数据，帮你便捷、高效地实现产品性能测试、演示，环境搭建、BI报表设计和Demo搭建。快来体验： https://blog.csdn.net/chengxu28/article/details/133387301
Fury：一个基于JIT动态编译的高性能多语言原生序列化框架
linch64: maven都无法导入fury, 怎么体验呢?
Quick BI 的可视分析之路
gggidt: 波动分析，是需要企业版才能支持的吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。