csdn的新闻更新真快,10月31日快报,原帖:http://www.csdn.net/article/2013-10-31/2817360。
要点:
Cloudera与初创公司Databricks展开了一项合作,在Cloudera的Hadoop软件内集成和支持Apache Spark数据处理平台。
Cloudera决定提供Apache Spark的全企业级支持——类似Hadoop发行版里的定制内容及付费产品支持,不仅仅是技术整合。
Spark是一个内存中的数据处理平台,兼容Hadoop数据源,但是比Hadoop MapReduce运行的更快。它非常适合机器学习作业,以及交互式数据查询,非常易于开发者使用,因为它包含了Scala、Python、Java的API。
Spark已经在大量的网络公司和网络创业公司中使用,一个旨在商业化Spark的初创公司Databricks近日获得了1400万美元的风险投资。