不用搭集群学习大数据的网站(hue),快来感受下hive的魅力吧
废话不多说先上网址:http://demo.gethue.com/hue/
(谷歌浏览器打不开换IE浏览器试一试)
用户名:demo
密码:demo
进去就可以操作随时可以学习大数据了。
进去hue界面后操作步骤
大家在里面可以随时写自己的HIVE了,一般的HIVE会转换成MapReduce程序跑出数据。
虽然说这个界面简单易操作,适合入门,但是要真正的学习大数据不仅要自己搭载集群还要懂得背后的原理和优化方法。
个人总结学习大数据组件hive三个步骤:
1、如何使用hive
首先要明白什么是HIVE,HIVE是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。它是hadoop的一个组件,在下图当中可以看到hive所处的位置。
其次为什么用hadoop中的hive,这里简单说一下,因为现在是大数据时代,移动互联网每天产生的数据可以用pb级别来衡量,传统的关系型数据根本不能满足其存储和计算需求。