饿了么 python_饿了么深度学习平台 elearn

最新推荐文章于 2022-03-21 11:54:44 发布

weixin_39834084

最新推荐文章于 2022-03-21 11:54:44 发布

阅读量178

点赞数

文章标签：饿了么 python

本文链接：https://blog.csdn.net/weixin_39834084/article/details/111433952

版权

Deep Learning、AI、Machine Learning

关于"深度学习、AI、Machine Learning"，基本上这三个词同时都听得见，但是大家不太清楚其中的关系。

这三者的关系是这样，AI 是最大的范围，带点智能都可以叫 AI；Machine Learning 主要分两块，一块是相对传统的，比如基于一些决策树模型；另一块就是现在的Deep Learning。

Hadoop & Spark 和 Tensorflow 的关系

说到机器学习、大数据，大家听到的是 Hadoop 和 Spark 居多，它们跟 TensorFlow 是一个什么样的关系呢？是不是有 TensorFlow 就不需要 Spark 这些？

像 Hadoop 跟 Spark，背后都是 MapReduce。Hadoop 更多是去写文件，Spark 更多是通过内存。它们通过 MapReduce，下发 task 给这些 executor 去做。

它们擅长的这种并行运算叫“Embarrassingly Parallel”，这种并行是非常完美的并行，要非常完美，最后收集结果。那么 Hadoop、Spark 用在哪？机器学习第一步非常关键，就是对数据的预处理，因为互联网公司有非常多结构化数据，存在 Hive、MySQL 里面。这些数据经过处理以后才能供机器学习使用。这类的预处理非常适合用 Hadoop、Spark 这些来做。

Tensorflow 优势

TensorFlow 特别擅长做深度学习，如果一些神经网络，最后放在一个 graph 上看的话，很轻松就会达到一个很复杂的程度。所以，这样一个 graph，用前面的 MapReduce 其实很难写，而且它也没办法那样完美并行，而且深度学习还有个反向传播的过程，更难做了。所以 Hadoop 跟 Spark 从架构本质上，根本就是做不了深度学习的。所以就出现了 TensorFlow。

为什么需要 TensorFlow 来做深度学习？TensorFlow 大体的思路是这样，用 Python，一般是用 Python 定义好深度学习神经网络以后，TensorFlow 会做成 DAG，有向无环图，然后把 DAG 交给 TensorFlow 的 C++ Core 来运行，这样保证它的运算效率非常高。所以我个人认为，对于一个 framework 是否支持深度学习，最关键的就是：它是否支持构建 DAG 和进行 DAG 运算。

数据准备好了之后，我们把数据放在分布式存储里面。上面跑分布式 TensorFlow，然后 TensorFlow 用集群里的 CPU 资源和 GPU 资源做 training。

当模型训练好，用 TensorFlow Serving 能够接收线上的请求，实时做出预测。分布式存储和计算，这样两块组合起来，这是深度学习平台 elearn 做的事情。

elearn ：overview

elearn 是 TaaS (TensorFlow as a Service)，去年 8 月底开始研发，受到 Google CloudML 的启发。我们 elearn 的一个核心想法就是：我们让算法工程师可以专注于算法，他们不用再多花精力去搞 CPU 资源、去搞发布。他们只要专心写算法就可以了，后面的事情全部交给 elearn。

最低0.47元/天解锁文章

weixin_39834084

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
饿了么 python_饿了么深度学习平台 elearn

Deep Learning、AI、Machine Learning关于"深度学习、AI、Machine Learning"，基本上这三个词同时都听得见，但是大家不太清楚其中的关系。这三者的关系是这样，AI 是最大的范围，带点智能都可以叫 AI；Machine Learning 主要分两块，一块是相对传统的，比如基于一些决策树模型；另一块就是现在的Deep Learning。Hadoop &...
复制链接

扫一扫