Hive
木生火18624
多练内功
展开
-
22HIVE的分区分桶——好程序
为什么要分区?随着系统运行时间增长,表的数据量越来越大,而hive查询通常是全表扫描,这样会导致大量不必要的数据扫描,从而大大降低了查询效率。从而引进了分区技术,使用分区技术,避免hive全表扫描,提升查询效率。分区的技术PARTITIONED BY (column_name data_type)1、hive分区是区分大小写的2、hive的分区本质是在表目录下创建分区目录,但是该分区...原创 2020-02-24 19:47:03 · 469 阅读 · 0 评论 -
21HIVE的基本操作——好程序
表的修改操作不建议用 in ,not in ,exists,not exists,而是用joininnot inexistsnot existsjoin查看表show create table 表名修改表:hivealter table t_name rename to (comment:说明)alter table t3 rename to t_userinfo...原创 2020-02-24 14:26:11 · 561 阅读 · 0 评论 -
20HIVE的基本操作——好程序
注释///***/<!---->#-- 语法规则:hive的数据库名、表名不区分大小写。mysql是可以设置区分大小写的命名规则:1、名字不能使用数字开头2、不能使用关键字3、尽量不要使用特殊符号hive中有一个默认的数据库default,如果不指定要使用哪个数据库,则使用默认的数据库。可以查看数据库show databases;再切...原创 2020-02-23 11:36:06 · 286 阅读 · 0 评论 -
19hive的基本知识——好程序
为什么有hivefacebook最初研发来处理海量的社交数据和机器学习。hive:简化分析:使用sql,开发效率高500行mr:10000hive是什么hive是一个大数据仓库hive是一个基于hadoop的数据仓库hive是一个基于hadoop的数据仓库,可以通过类sql语句来对数据进行读、写、管理(元数据管理)hive的架构(三层)用户连接客户端:cli、jdbc/o...原创 2020-02-23 08:56:07 · 323 阅读 · 1 评论