- 博客(59)
- 收藏
- 关注
原创 Hive零基础从入门到实战 入门篇(十九) HiveQL:JOIN语句
目录前言1. 内连接 INNER JOIN1.1 语法1.2 举例2.外连接之 LEFT OUTER JOIN2.1 语法2.2 举例2.2.1 多个结果做关联展示2.2.2 从左表中去掉和右表有交集的部分3.外连接之 RIGHT OUTER JOIN3.1 语法4.外连接之 FULL OUTER JOIN4.1 语法5. 总结...
2019-06-18 20:25:42
10808
7
原创 Hive零基础从入门到实战 入门篇(十八) HiveQL:子查询与WITH AS 语句
目录前言1. 子查询1.1 在FROM后使用子查询语法1.1.1语法1.1.2 举例1.2 在WHERE后使用子查询1.2.1 语法1.2.2 举例2.WITH AS语句2.1 语法2.2 举例前言本文主要介绍Hive中子查询与WITH AS 语句的用法,为后续多表查询的介绍奠定基础。1. 子查询1.1 在FROM后...
2019-06-15 18:46:38
11589
原创 Hive零基础从入门到实战 入门篇(十七) HiveQL:语句顺序及逻辑执行顺序
目录前言1. 编写HiveQL的语句顺序2.HiveQL的逻辑执行顺序前言了解HiveQL的语句顺序及逻辑执行顺序可以使我们编写效率更高的代码,并且减少错误,下面我们来分别详细介绍。1. 编写HiveQL的语句顺序所有语句的编写顺序为:select … from … where … group by … having … order by …具体语法...
2019-06-13 14:03:08
11136
2
原创 Hive零基础从入门到实战 入门篇(十六) HiveQL:ORDER BY语句
目录前言1. 基本语法2. 参数设置3. 举例前言Hive中ORDER BY语句和其他的SQL方言中的定义是一样的,会对查询结果集执行一个全局排序。这也就是说会有一个所有的数据都通过一个reduce进行处理的过程。对于大数据集,这个过程可能会消耗漫长的时间来执行,甚至会执行失败。不过这点并不用太过担心,因为大多数时候都不会有需求要对大数据集进行paixu用户可以...
2019-06-12 20:11:02
10826
原创 Hive零基础从入门到实战 入门篇(十五) HiveQL:聚合函数、GROUP BY语句、HAVING语句
目录前言1. 聚合函数2. GROUP BY语句2.1 去重2.2 与聚合函数一起使用2.2.1count(*)2.2.2count(col)2.2.3count(distinct col)2.2.4 sum(col)2.2.5 avg(col)2.2.6 min(col)2.2.7 max(col)2.2.8 GROUP BY字...
2019-06-05 20:22:47
13827
原创 Hive零基础从入门到实战 入门篇(十四) HiveQL:WHERE 语句
目录前言1. 基本语法2. 谓词操作符详解3. AND、OR4.LIKE、RLIKE、REGEXP前言SELECT语句用于选取字段,本文我们来介绍用于过滤条件的WHERE语句。两者结合使用可以查找到符合过滤条件的记录。在介绍WHERE语句之前我们已经上文的一个简单例子中使用过它了。之前都是假定大家是见过这样的语句的,现在我们将更多地探讨一些细节。WHER...
2019-06-03 09:23:35
11182
4
原创 Hive零基础从入门到实战 入门篇(十三)HiveQL:SELECT …… FROM …… 语句
目录前言1.查询表中的的内容1.1 Hive严格模式2. limit :限制查询返回行数3. 列四则运算4. 列别名前言本文来介绍HQL中最基础的查询语句:SELECT ……FROM……语句。这部分其实和其他SQL方言的语法并无区别,但也会介绍一些Hive独有的参数设置内容。1.查询表中的的内容查询指定的某一列或某几列,命令如下:SE...
2019-05-29 09:40:59
12859
原创 Hive零基础从入门到实战 入门篇(十二)Hive中的命令运行方式
目录前言1. Hive中的一次使用命令: hive -e2. 执行文件中的Hive命令: hive -f3.在shell脚本中使用hive -e命令前言Hive中的命令运行方式常见的有4种,分别是:直接在命令行界面,也就是CLI上运行脚本 执行一句或多句命令,不进入CLI hive -e "命令" 执行文件中一句或多句...
2019-05-17 09:20:15
11102
原创 Hive零基础从入门到实战 入门篇(十一)在.hiverc文件中配置常用参数
目录前言1. 在~目录创建一个.hiverc文件2. 输入常用命令或参数3. 启动Hive验证是否生效前言在home目录~中创建一个隐藏文件.hiverc,然后在其中配置常用参数或命令,之后Hive每次启动时会自动加载这个文件中的内容。1. 在~目录创建一个.hiverc文件#进入home目录cd#创建.hiverc文件vim .hiver...
2019-05-15 09:02:19
10922
原创 Hive零基础从入门到实战 入门篇(十)HiveQL:将csv文件中的数据导入Hive
目录前言1. 数据装载 Load1.1filepath1.2 LOCAL1.3OVERWRITE1.4 PARTITION1.5 举例前言本文介绍如何将文件中的数据导入Hive表中。1. 数据装载 Load将文件中的数据导入Hive中要使用Load关键字,具体完整语法如下,[ ]中的均为可选项:load data [local...
2019-05-10 09:30:34
11641
2
原创 Hive零基础从入门到实战 入门篇(九)如何高效使用notepad编辑HQL
目录前言1. 安装32位的7.4版本notepad2. 设置背景及字体3. 编辑3.1 复制当前文件路径、文件名3.2 缩进3.3 转换文本大小写3.4 行操作3.5 注释3.6 选择语言3.7 函数自动补齐3.8 空格操作3.9 列操作3.10 常用简单操作4. 查找与替换5. 视图5.1 全屏模式5.2 便签模式...
2019-05-02 16:19:07
13321
原创 Hive零基础从入门到实战 入门篇(八)HiveQL:表操作(下)
目录前言1. 表的重命名2. 重命名字段、数据类型、注释3. 增加列4. 删除、替换列5. 删除分区6. 修改表的存储路径前言本文主要介绍Hive中修改表的操作。1. 表的重命名命令如下:alter table oldname rename to new_name;下面我们将上文中建好的表t_od_use_cnt重命名为t_o...
2019-04-25 09:31:33
11405
原创 Hive零基础从入门到实战 入门篇(七)HiveQL:表操作(上)
目录前言1. 最简单的建表语句2. 查看表结构3. 删除表4. 建表时为字段添加注释5. 建表可选项IF NOT EXITS6.建表可选项 EXTERNAL6.1 内部表6.2 外部表7. 建分区表8. 其余建表可选项9. 查询既有表的建表语句前言熟悉了Hive的库操作后,本文来介绍Hive中的的建表、删表操作。1. 最简单...
2019-04-20 09:57:31
12077
原创 Hive零基础从入门到实战 入门篇(六)HiveQL:数据库操作
目录前言1. 查看Hive中当前有哪些数据库2. 创建数据库3. 通过正则匹配筛选数据库4. 创建同名数据库抛出错误5. 查询数据库属性5.1 普通查询5.2 简略写法5.3 额外查询5.4 如建库时增加备注可在此查看6. 使用数据库7. 显示当前所在数据库8. 删除数据库8.1 普通删除8.2 强制删除前言首先按照入门篇(一)环...
2019-04-12 10:18:18
11140
1
原创 Hive零基础从入门到实战 入门篇(五)Hive常用数据类型
目录前言1. 常用基本数据格式2. 常用的集合数据类型3. Hive和其他SQL的数据格式有何区别4. TIMESTAMP5. 数据类型转换5.1 显式转换5.2 隐式转换前言掌握了前三篇博文的Linux基础操作后,本节我们正式开始Hive的学习,首先来熟悉一下Hive中的常用数据格式。1. 常用基本数据格式数据类型 长度 范围及举...
2019-04-10 13:50:28
11006
5
原创 Hive零基础从入门到实战 入门篇(四)Linux系统简单操作(下)
目录前言3.Shell编程3.1建立一个脚本3.2 Shell命令3.2.1 Unix命令3.2.2管道、重定向3.2.3流程控制4.crontab定时任务4.1 操作命令4.2crontab文件语法4.3 crontab实例前言本文承接上文,继续介绍Linux常用基本操作,上文链接:Linux系统简单操作(中),本文将介绍使用Hive时...
2019-04-09 14:11:20
10765
原创 Hive零基础从入门到实战 入门篇(三)Linux系统简单操作(中)
目录前言2.2文件的基本操作2.2.1 创建文件2.2.2 创建目录2.2.3拷贝文件2.2.4拷贝目录2.2.5 剪切文件(目录)2.2.6删除文件(目录)2.2.7 查看文件2.2.8 编辑文件前言本文将会承接上文,继续介绍linux基本操作命令,上文链接:Linux系统简单操作(上)2.2文件的基本操作2.2.1 创建文...
2019-04-07 18:36:58
11220
原创 Hive零基础从入门到实战 入门篇(二)Linux系统简单操作(上)
目录前言1.初识Linux2.Linux常用命令2.1 访问查看2.1.1 查看当前所在目录路径2.1.2 查看当前目录里有哪些文件2.1.3 查看指定目录里有哪些文件2.1.4 强迫症患者福音:清屏前言因为Hive是安装在Linux系统中,所以本文来介绍一些数据分析师会常用到的Linux基本命令和操作。在实际工作中,我们会通过Xshell远程连接公司机房的...
2019-04-06 16:51:25
11664
1
原创 Hive零基础从入门到实战 入门篇(一)环境搭建
目录前言1.Hive是什么2.Hive学习环境搭建前言作为一个数据分析师,操作Hive提取数据已经成为了一个必备技能,但对数据分析师来说,查询才是做的最多的操作,毕竟使用工具是为了完成分析。所以我认为数据分析师是不需要掌握Hive具体的底层架构、安装运维、甚至是运行原理等知识的,毕竟我们不是运维也不是大数据开发工程师,实际工作中也确实用不到这些知识,所以我总结的知识点主要...
2019-04-05 21:11:23
13580
23
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅