【大数据开发】你知道大数据语言的工具与框架吗?

为了解大数据的当前和未来状态,我们采访了来自28个组织的31位IT技术主管。我们问他们,“你在数据提取,分析和报告中使用的最流行的语言,工具和框架是什么?” 以下的文章是他们告诉我们的记录,经过总结如下。

Python,Spark,Kafka

随着大数据和对人工智能AL/机器学习 ML 的推动,Scala和Python语言以及Apache Spark中越来越受欢迎。

对OLAP数据仓库的迁移,如果用 Python开发机器学习使用较少的结构。开发者编写Python ML模型非常方便,Python有扩展库提供支持。 

Kafka用于流式提取,R和Python用于编程开发,当然Java很普遍。SQL还不会消失,但它不是大数据最好的朋友,但是它的开放性让更多的人可以访问数据,Gartner让Hadoop上的SQL走出了幻灭之低谷。

我们看到很多数据仓库的相关技术,如Hadoop,Spark和Kafka等新兴技术,很多人还对Redshift,Snowflake和Big Query非常感兴趣。

ML机器学习技术栈,增加了TensorFlow的强大工具让人增加对其学习的信心,减小了学习曲线。

第三个是Kubernetes,也聚集了大量的爱好者,并在逐步扩大用户领域。 

还有其他开源工具被广泛使用,例如Spark,R和Python,这就是平台提供与这些开源工具集成的原因。

在大数据工作流程中,可以引入一个新节点用Python,R或Spark开发代码脚本。在执行时,节点将执行代码成为工作流中节点管道的一部分。

在之前一段时间,R语言曾占据主导地位,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值