insertintotable test values('1006','big');insert overwrite table test values('1006','big');#覆盖插入
2.3 as select 创建表
createtableifnotexists student3
asselect id, name from student;
2.4localtion 指定数据源建表
create external table test10(
id string,
name string
)row format delimited
fieldsterminatedby'\t'
location '/user/hive/warehouse/test';
2.5查询(大块)
1.常用函数
count(),msx(),min(),avg(),sum()2.limit语句,长用于返回前几条数据
3.like和rlikelike'A%',rlike[A]查找名字中带有 A 的员工信息
4.Groupby分组
5.having,常用于后接groupby6.joinonjoinon内连接
leftjoin 左外
rightjoin 右外
fulljoin满外连接
7.笛卡尔积
省略连接条件,所有表相互连接(数据冗余恐怖)
8.orderbyascdesc 降序
#全局排序,效率较低9.Sort By
每个reduce区内有序
set mapreduce.job.reduces=3;#设置reduce个数10.Distribute By
后接sort by,根据分区字段对reduce个数%后的余数进行分区。
11.Cluster By
兼具Distribute By和Sort By的功能
select*from emp cluster by deptno;select*from emp distribute by deptno sort by deptno;#以上两种写法等价
2.6导入导出数据
1.格式化导出到本地
insert overwrite local directory
'/opt/module/hive/data/export/student1'ROW FORMAT DELIMITED FIELDSTERMINATEDBY'\t'select*from student;#不加local就是hdfs路径