你知道大数据语言的工具与框架吗？

最新推荐文章于 2022-12-08 18:12:46 发布

大数据基础入门教程

最新推荐文章于 2022-12-08 18:12:46 发布

阅读量972

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mnbvxiaoxin/article/details/104909479

版权

本文汇总了31位IT技术主管的观点，揭示了大数据领域常用的语言、工具和框架。Python、Spark、Kafka、Scala、R、Java、SQL、TensorFlow、Tableau和PowerBI等在数据提取、分析和报告中占据重要地位。随着AI和机器学习的发展，Python和Spark尤其受到青睐。Kafka在流数据处理中扮演关键角色，而SQL尽管不是大数据的最佳选择，但仍具有广泛使用。此外，工具如Hadoop、Spark、Kinesis、Tableau、PowerBI和Docker、Kubernetes在数据处理和部署中也十分常见。

摘要由CSDN通过智能技术生成

为了解大数据的当前和未来状态，我们采访了来自28个组织的31位IT技术主管。我们问他们，“你在数据提取，分析和报告中使用的最流行的语言，工具和框架是什么？” 以下的文章是他们告诉我们的记录，经过总结如下。

Python，Spark，Kafka

随着大数据和对人工智能AL/机器学习 ML 的推动，Scala和Python语言以及Apache Spark中越来越受欢迎。

对OLAP数据仓库的迁移，如果用 Python开发机器学习使用较少的结构。开发者编写Python ML模型非常方便，Python有扩展库提供支持。

Kafka用于流式提取，R和Python用于编程开发，当然Java很普遍。SQL还不会消失，但它不是大数据最好的朋友，但是它的开放性让更多的人可以访问数据，Gartner让Hadoop上的SQL走出了幻灭之低谷。

我们看到很多数据仓库的相关技术，如Hadoop，Spark和Kafka等新兴技术，很多人还对Redshift，Snowflake和Big Query非常感兴趣。

ML机器学习技术栈，增加了TensorFlow的强大工具让人增加对其学习的信心，减小了学习曲线。

第三个是Kubernetes，也聚集了大量的爱好者，并在逐步扩大用户领域。

还有其他开源工具被广泛使用，例如Spark，R和Python，这就是平台提供与这些开源工具集成的原因。

在大数据工作流程中，可以引入一个新节点用Python，R或Spark开发代码脚本。在执行时，节点将执行代码成为工作流中节点管道的一部分。

在之前一段时间，R语言曾占据主导地位，特别

最低0.47元/天解锁文章

大数据基础入门教程

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。