目前企业应用Spark最大的困难是什么

据我有限的了解,最大的困难还是人才方面的短缺。无论Spark还是Spark所使用的Scala,都还是相当年轻的事物。虽然它们各自都已经吸引了大批富有远见和才华的开发者,但不得不说距离大规模普及还有相当长的一段路要走。另一个相关问题是Spark方面的参考材料还不多。目前社区内开发者们主要的学习方式还限于阅读有限的官方文档、源码、AMPLab发表的论文,以及社区讨论。所幸Fast Data Processing with Spark一书的中文版已经在翻译中;由O'Reilly出品,来自Spark核心团队的Learning Spark今年也有望面世。

- 根据您的了解,目前Spark发展的情况如何?

评价一个开源项目发展情况的重要指标之一就是该项目的贡献者人数。对于这一点,在去年12月份的Spark Summit上,Spark的创始人Matei Zaharia博士十分自豪:“过去六个月内,Spark的活跃开发者人数超过了Hadoop MapReduce!”那时Spark贡献者总人数是103人;而今四个月过去了,根据GitHub最新的统计,这一数字已然增长到了153人。特别值得一提的是,在最近发布的几个版本中,华人开发者的人数飞速上升。Spark项目主站中Powered by Spark页面中不断增长的公司列表也是Spark在工业界稳步推进的有力证明。这份列表中不乏阿里巴巴、百度、点评、搜狐等中国企业的身影。如前所述,Spark的推广还任重道远,但其良好的向下兼容性、相对传统方法的显著优势,以及来自社区的巨大热情令我非常看好Spark的发展前景。

据人民网消息,5月26日,2018中国国际大数据产业博览会在贵州拉开帷幕,让基于大数据的技术创新和商业模式创新引发新一轮舆情关注。在此背景下,人民创投、人民网舆情数据中心联合发布《中国大数据独角兽企业TOP20榜》,推荐了大数据行业中的20家优秀独角兽企业。 这是继5月19日,人民创投、人民网舆情数据中心在“2018全球独角兽企业高峰论坛”上联合发布《中国独角兽企业价值榜》和《中国瞪羚企业价值榜》后,针对独角兽企业的又一次细分推荐。 推荐的20家大数据独角兽企业业务涉及数据采集存储、分析挖掘、流通服务、技术算法以及人工智能,分布于金融、安防、交通、物流、消费、教育、医疗等多个应用领域,如针对安防领域的商汤科技、服务于互联网金融领域的同盾科技、“医疗大数据”平台医渡云等。 据介绍,榜单由专家评委结合舆情分析系统,从数据复杂度、分析技术、应用场景等角度考察企业的核心技术和创新能力,综合投资价值、社会效应、市场前景和品牌感知等维度,对入围企业进行评价。入围企业标准为:估值在65亿人民币以上、创办时间小于10年的公司,企业尚未独立上市或被收购,非其他企业的全资企业,有公开的融资纪录;企业具备较好的投资价值,特别是有较大的成长空间;企业在模式、技术等方面具备领先性,技术密集、创新驱动,能支持国家战略或带动新业态;企业业务积极正向,没有被有关部门查处的重大违法纪录,无重大负面或争议性报道。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值