利用Hadoop处理大数据现在如火如荼,EMC发布了自己的Hadoop,社区版和企业版,可以与GPDB完美集成在一起实现结构化,半结构化,非结构化大数据的高效混合分析。其中社区版完全基于Apache Hadoop,企业版使用C语言实现,更快,更可靠,使用管理更方便,并且完全兼容Apache Hadoop的开发访问接口。
这里提供给大家社区版及相关组件的下载链接,供学习研究使用。
推荐使用金山快盘,15G超大免费空间,相当于给电脑增加了一块永不消失的硬盘,传输速度快,并且可以通过电脑和手机随时随地访问快盘里的文件!通过下面地址注册,登录快盘客户端后你还能额外获取1GB快盘空间奖励。
http://www.kuaipan.cn/index.php?ac=account&op=register&channel=xnaos9
GPHD CE版
安装配置手册
HIVE HADOOP的SQL接口
Pig MapReduce的过程化语言开发接口
HBase 基于Hadoop的NOSQL数据库引擎
zookeeper Hadoop的作业高可用协调器
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/25548387/viewspace-713497/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/25548387/viewspace-713497/