1 内部表
先在hive里建一张表,然后向这个表插入数据(用insert可以插入数据,也可以通过加载外部文件方式来插入数据),这样的表称之为hive的内部表
2 外部表
HDFS里已经有数据了,然后,通过hive创建一张表来管理这个文件数据。则这样表称之为外部表 注意,hive外部表管理的是HDFS里的某一个目录下的文件数据
进入hive,执行:create external table stu (id int,name string) row format delimited fields terminated by ' ' location '/目录路径'
内部表和外部表的区别:
1 对于内部表,在删除该表的时候,HDFS对应的目录节点会被删除
2 对于外部表,在删除该表的时候,HDFS对应的目录节点不会删除
维度表:
维度表可以看成是用户用来分析一个事实的窗口,它里面的数据应该是对事实的各个方面描述,比如时间维度表,它里面的数据就是一些日,周,月,季,年,日期等数据,维度表只能是事实表的一个分析角度。
实体表:
实体表就是一个实际对象的表,实体表它放的数据一定是一条条客观存在的事物数据,比如说设备 ,它就是客观存在的,所以可以将其设计一个实体表。