Hive安装和运行
Pig与RDBMS、Hive比较
Pig Latin是一种数据流编程语言,而SQL是一种描述性编程语言。换句话说,Pig程序是相对于输入的一步步操作,其中每一步是对数据的一个简答的变换。相反,SQL语句是一个约束的集合,这些约束的集合在一起,定义了输出。
Hive介于Pig和传统RDBMS(关系数据库管理系统Relational DatabaseManagement System)之间,Hive的设计目的是让精通SQL既能的分析师能够在存放在HDFS的大规模数据集上运行查询。Hive在很多方面和传统数据库类似,但是它底层对HDFS和MapReduce的依赖意味着它的体系结构有别于传统数据库。
Hive本身不存储数据,完全依赖于HDFS和MapReduce,Hive可以将结构化的数据文件映射为一张数据库表,Hive中表纯逻辑,就是表的元数据。而HBase是物理表,定位是NoSQL。
Ubuntu操作系统,主机名hp,已部署Hadoop单节点伪分布,集成mysql作为元数据库。Hive默认的安装方式是Apache Derby,将元数据存储在Derby数据库中。Derby是一个完全用java编写的数据库,可跨平台在JVM中运行。
1)mysql安装
$sudo apt-get installmysql-server
登录mysql:$mysql -u root -p
建立数据库hive:mysql>create database hive;
mysql>show databases;//查看创建;
创建hive用户,并授权:mysql>grant all on hive.* to hive@'%' identified&

最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



