Arun C Murthy(Hortonworks创始人,Hadoop 2开发的领军者)在邮件列表中发布了这一消息。很快,他又在Hortonworks的官方博客发表文章,做了更详细的说明。
Hadoop 2.x是这个大数据核心平台的一次重大改版,将原来HDFS+MapReduce的架构重构为HDFS2+YARN(集群资源管理中间层)+上层服务(包括MapReduce, Tez, HBase on YARN (HOYA), Storm-on-YARN, Samza, Spark, OpenMPI等等)。
如今,作为Hadoop 2.x的第一个beta版,Apache Hadoop 2.1.0-beta的发布,意味着Hadoop 2.x的正式版也不远了(Murthy已经明确表示解决最后遗留的7个问题,还需要数周时间,希望能在9月中旬发布GA版)。官方发布公告表示,鼓励用户立即迁移到这一版本,因为稳定性大大提高,而且API和连接协议(wire protocol)都经过考验,会与未来兼容。
重要更新包括:
- HDFS和YARN的API都已经稳定(详情参见HADOOP-8990和YARN-386)
- 实现了与Hadoop 1.x MapReduce应用的二进制兼容(详情参见MAPREDUCE-5108)
- 支持在Windows 上运行Hadoop(详情参见HADOOP-8562)
- HDFS瞬像(详情参见HDFS-2802)
- HDFS支持NFS-v3访问(详情参见HDFS-4750)
- YARN应用开发者的客户端API(详情参见YARN-418)
- 与Hadoop生态系统中系统项目(Apache HBase, Apache Pig, Apache Hive)之间做了大量集成测试
详细的版本发布说明在这里。
而Zhijie Shen和Vinod Kumar Vavilapalli也适时地发表了一篇文章,介绍如何在Hadoop新版上运行原有的程序。