hive
璀璨下的一点星辰
这个作者很懒,什么都没留下…
展开
-
hive安装以及所填的坑
下载hive安装包:https://archive.apache.org/dist/hive/hive-1.2.1/我的spark是spark-2.2.0-bin-2.6.0-cdh5.7.0,hadoop是hadoop-2.6.0-cdh5.7.0 ,jdk是1.8安装过程很曲折:报错很多:原因是mysql数据库装得不对第一步:安装mysqlubuntu更换成阿里的镜像源...原创 2019-03-01 23:27:31 · 188 阅读 · 0 评论 -
hive介绍
hive的定义:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。1.为什么使用Hive1).直接使用hadoop所面临的问题 人员学习成本太高 项目周期要求太短2). MapReduce实现复杂查询逻辑开发难度太大2. 为什么要使用Hive操作接口采用类SQL语法,提供快速...原创 2019-03-03 09:49:32 · 174 阅读 · 0 评论 -
hive的一个小例子
create database shizhan03.db;create table t_sz;创建一个hivedemo的txt将txt文件上传到hadoop的hdfs上。truncate table t_sz;drop table t_sz;create table t_sz(id int,name string)row format delimitedfields ter...原创 2019-03-03 13:24:03 · 295 阅读 · 0 评论 -
Hive基本操作
1.DDL操作:1.1创建表建表语法CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name[(col_name data_type [COMMENT col_comment], ...)][COMMENT table_comment][PARTITIONED BY (col_name data_type [CO...原创 2019-03-03 15:05:42 · 169 阅读 · 0 评论 -
Hive分桶
上述讲述的是将一个表按照id去分成四个桶set hive.enforce.bucketing = true开启分桶set mapreduce.job.reduces=4 分桶数量要和reduces数量一致create table t_buck(id string,name string)clustered by(id)sorted by(id)into 4 buckets...原创 2019-03-03 16:25:34 · 173 阅读 · 0 评论 -
hive练习小例子
course.txt1,数据库2,数学3,信息系统4,操作系统5,数据结构6,数据处理sc.txt95001,1,8195001,2,8595001,3,8895001,4,7095002,2,9095002,3,8095002,4,7195002,5,6095003,1,8295003,3,9095003,5,10095004,1,8095004...原创 2019-03-03 23:53:19 · 313 阅读 · 0 评论 -
hive的join
a 和 bselect * from a inner join b on a.id=b.id 显示a和b都id都相等的值select * from a left join b on a.id=b.id 按a的id去找b的 b中没有用null显示select * from a right join b on a.id=b.id ...原创 2019-03-04 00:11:14 · 642 阅读 · 0 评论