用Spark+ TensorFlow训练和应用深度学习模型

最新推荐文章于 2024-07-10 22:17:05 发布

周建丁

最新推荐文章于 2024-07-10 22:17:05 发布

阅读量5.2k

点赞数

文章标签： TensorFlow Spark 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/happytofly/article/details/80121700

版权

Tim Hunter在databricks博客发布博文，演示如何使用TensorFlow和Spark一起训练和应用深度学习模型。

两个use cases：

超参数调整：用Spark找到神经网络训练的最佳超参数，减少10倍的训练时间，降低34%的误差率。
大规模部署模型：利用Spark在大量数据上应用一个训练的神经网络模型。

训练的超参数，如每层的神经元、学习率，太多或者太少都不行。TensorFlow（开源版）本身并不是分布式的，超参数调优处理是“尴尬的并行”，可以通过Spark实现分布式，使用Spark广播常见元素如数据和模型描述，并通过支持容错的集群安排单个的重复计算。采用默认超参数设置，精度为99.2%，最好的结果为99.47%，误差率降低34%。

图片描述

线性扩展能力，13节点的集群可以并行训练13个模型，相对于用一台机器每次训练一个模型提速7倍。

图片描述

神经网络典型权衡曲线：

学习率非常关键，太低学不到东西（高测试误差），太高则训练过程可能随机振荡甚至在某些配置下发散。
神经元的数目对性能没那么重要，大量神经元的网络对学习率更敏感。

图片描述

<

最低0.47元/天解锁文章

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
2
评论
用Spark+ TensorFlow训练和应用深度学习模型

Tim Hunter在databricks博客发布博文，演示如何使用TensorFlow和Spark一起训练和应用深度学习模型。两个use cases：超参数调整：用Spark找到神经网络训练的最佳超参数，减少10倍的训练时间，降低34%的误差率。大规模部署模型：利用Spark在大量数据上应用一个训练的神经网络模型。训练的超参数，如每层的神经元、学习率，太多或者太少都不行。TensorFlo...
复制链接

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。