1.Hive适合于数据仓库应用程序,使用该应用程序进行相关的静态数据分析,不需要快速响应给出结果,而且数据不会频繁变化。
2.Hive不是一个完整的数据库,不支持记录级别的更新,删除,插入操作。但可以通过查询将结果生成新表或导入文件中。
3.Hive不支持事务。
4.Hadoop是一个面向批处理的系统,MapReduce任务的启动过程需要消耗较长的时间,所以Hive的查询延时比较严重。
5.常用命令:
hive可以直接输入的dfs命令
6.数据类型
CREATE TABLE employees(
name STRING,
salary FLOAT,
subordinates ARRAY<STRING>,
deductions MAP<STRING,FLOAT>,
address STRUCT<street:STRING,city:STRING,state:STRING,zip:INT>);
- name是一个简单的字符串
- salary(薪水)使用float浮点数
- subordinates(下属员工)列表是一个字符串数组,在该书组内,认为name是主键,因此subordinates中的每个元素都将会引用该表中的另一条记录,该字段可以为空数组
- deductions是一个由键值对构成的map,其记录每次的扣除额,这些钱会在发薪水时从工资中扣除,map的键值表示扣除金额项目的名称。
- address由struct数据类型存储,并为每个域命令