hive
文章平均质量分 76
Next__One
学生
展开
-
hive的简单入门
hive常用命令cli 1.清屏 CTRL+L || !clear; 2.查看数据库中的表 show tables; 3.查看内置函数 show functions; 4.查看表结构 desc tablename; 5.查看hdfs 上的文件 dfs -ls 目录 6.执行操作系统命令 !命令; 7.执行hql语句 select *** from *** 8.执行外部原创 2017-08-24 14:57:51 · 560 阅读 · 0 评论 -
配置hive的环境变量
配置hive的环境变量 1、在linux用户的home目录下,创建 .hiverc ,默认当前用户下可以使用这个配置 路径 :/home/kwu 2、在hive的配置文件目录下,创建 .hiverc ,默认所有用户都可以使用这个配置,更改hive配置会影响此文件 路径 : /etc/hive/conf .转载 2017-10-19 11:00:11 · 2180 阅读 · 0 评论 -
对现有Hive的大表进行动态分区
分区是在处理大型事实表时常用的方法。分区的好处在于缩小查询扫描范围,从而提高速度。分区分为两种:静态分区static partition和动态分区dynamic partition。静态分区和动态分区的区别在于导入数据时,是手动输入分区名称,还是通过数据来判断数据分区。对于大数据批量导入来说,显然采用动态分区更为简单方便。 - 对现存hive表的分区 首先,新建一张我们需要的分区以后的转载 2017-10-23 20:18:40 · 699 阅读 · 0 评论