学习来源:http://www.aboutyun.com/thread-6179-1-1.html
http://blog.csdn.net/yuexianchang/article/details/52468291
http://www.cnblogs.com/xing901022/p/6195422.html
说明:由于参考资料大多是2013年以前的,所以有些说法也许并不成立,请读者选择性吸收。
如前所述,Hadoop是一个能够对大量数据进行分布式处理的软件框架,它是一种技术的实现,是云计算技术中重要的组成部分。
一、hadoop的用途和使用场景(http://www.aboutyun.com/thread-5726-1-1.html)
·大数据量存储:分布式存储
·日志处理: Hadoop擅长这个
·海量计算: 并行计算
·ETL:数据抽取到ora
·日志处理: Hadoop擅长这个
·海量计算: 并行计算
·ETL:数据抽取到ora