「揭秘GP」Greenplum 数据库进军深度学习领域

最新推荐文章于 2022-01-19 12:32:19 发布

Greenplum中文社区

最新推荐文章于 2022-01-19 12:32:19 发布

阅读量500

点赞数

文章标签：数据库大数据深度学习

本文链接：https://blog.csdn.net/gp_community/article/details/106567717

版权

本文揭示了Greenplum如何利用GPU加速深度学习算法，通过集成Apache MADlib在数据库内部实现机器学习功能。在SQL环境中直接进行深度学习，减少数据移动，提高效率。实验表明，GPU加速的Greenplum在模型训练和批量推断上展现出显著的性能提升，为数据科学家提供了更便捷的深度学习解决方案。

摘要由CSDN通过智能技术生成

了解更多Greenplum技术干货，欢迎访问Greenplum中文社区网站

深度学习（Deep Learning）开始成为企业计算的一个更重要的部分，这是因为人工神经网络在自然语言处理，图像识别，欺诈检测和推荐系统等领域非常有效。在过去的五到十年中，计算机的计算能力有了极大的增强，以及海量数据的出现，这一切促使人们对使用深度学习算法解决问题产生了兴趣。

另一方面，企业的业务系统大多基于SQL的基础架构，在软件和员工培训方面进行了大量投资。然而，深度学习的主要创新发生在SQL世界之外，因此企业使用深度学习算法是需要采用独立的深度学习基础设施。因此，在传统的SQL架构之外搭建深度学习系统，不仅需要考虑到额外的费用和工作量，也需要考虑开发新数据孤岛的风险。此外，在系统之间移动大型数据集效率不高。如果企业可以在MPP关系数据库中使用流行的深度学习框架（如Keras和TensorFlow）执行深度学习算法，那么，这将使企业能够利用他们在SQL中的现有投资，使深度学习更容易，更平易近人。

此外，另一个需要考虑因素是当今许多数据科学问题中需要应用多种模型。一般情况下，数据科学家在分析数据特征工程上经常花费大量时间采用多种方法来解决问题，在这种情况下数据分析的结果通常是多种模型的结合体。在这种情况下，使用同一个计算引擎进行所有的计算将比使用不同系统分别计算然后组合结果更有效率。为此，在数据库内部内建一组机器学

最低0.47元/天解锁文章

Greenplum中文社区

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
「揭秘GP」Greenplum 数据库进军深度学习领域

深度学习（Deep Learning）开始成为企业计算的一个更重要的部分，这是因为人工神经网络在自然语言处理，图像识别，欺诈检测和推荐系统等领域非常有效。在过去的五到十年中，计算机的计算能力有了极大的增强，以及海量数据的出现，这一切促使人们对使用深度学习算法解决问题产生了兴趣。另一方面，企业的业务系统大多基于SQL的基础架构，在软件和员工培训方面进行了大量投资。然而，深度学习的主要创新发生在SQL世界之外，因此企业使用深度学习算法是需要采用独立的深度学习基础设施。因此，在传统的SQL架构之外搭建深度学习
复制链接

扫一扫