1. 查询语言。由于 SQL 被广泛的应用在数据仓库中,因此专门针对 Hive 的特性设计了类 SQL的查询语言 HQL(发音“海口”)。熟悉 SQL 开发的开发者可以很方便的使用Hive 进行开发。
2. 数据存储位置。Hive 是建立在Hadoop 之上的,所有 Hive 的数据都是存储在 HDFS 中。而数据库则可以将数据保存在块设备或者本地文件系统中。
3. 数据格式。Hive 中没有定义专门的数据格式,数据格式可以由用户来指定,用户定义数据格式需要指定三个属性:列分隔符(通常为空格、”\t”、”\x001″)、行分隔符(”\n”)以及读取文件数据的方法(Hive中默认有三个文件格式 TextFile,SequenceFile,RCFile)。由于在加载数据的过程中,不需要从用户数据格式到Hive定义的数据格式的转换,因此Hive在加载的过程中不会对数据本身进行任何修改,而只是将数据内容复制或者移动到相应的HDFS目录中。而在数据库中,