自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

风影楼的博客

数据分析师

  • 博客(59)
  • 收藏
  • 关注

原创 Hive零基础从入门到实战 入门篇(十九) HiveQL:JOIN语句

目录前言1. 内连接 INNER JOIN1.1 语法1.2 举例2.外连接之 LEFT OUTER JOIN2.1 语法2.2 举例2.2.1 多个结果做关联展示2.2.2 从左表中去掉和右表有交集的部分3.外连接之 RIGHT OUTER JOIN3.1 语法4.外连接之 FULL OUTER JOIN4.1 语法5. 总结...

2019-06-18 20:25:42 10808 7

原创 Hive零基础从入门到实战 入门篇(十八) HiveQL:子查询与WITH AS 语句

目录前言1. 子查询1.1 在FROM后使用子查询语法1.1.1语法1.1.2 举例1.2 在WHERE后使用子查询1.2.1 语法1.2.2 举例2.WITH AS语句2.1 语法2.2 举例前言本文主要介绍Hive中子查询与WITH AS 语句的用法,为后续多表查询的介绍奠定基础。1. 子查询1.1 在FROM后...

2019-06-15 18:46:38 11589

原创 Hive零基础从入门到实战 入门篇(十七) HiveQL:语句顺序及逻辑执行顺序

目录前言1. 编写HiveQL的语句顺序2.HiveQL的逻辑执行顺序前言了解HiveQL的语句顺序及逻辑执行顺序可以使我们编写效率更高的代码,并且减少错误,下面我们来分别详细介绍。1. 编写HiveQL的语句顺序所有语句的编写顺序为:select … from … where … group by … having … order by …具体语法...

2019-06-13 14:03:08 11136 2

原创 Hive零基础从入门到实战 入门篇(十六) HiveQL:ORDER BY语句

目录前言1. 基本语法2. 参数设置3. 举例前言Hive中ORDER BY语句和其他的SQL方言中的定义是一样的,会对查询结果集执行一个全局排序。这也就是说会有一个所有的数据都通过一个reduce进行处理的过程。对于大数据集,这个过程可能会消耗漫长的时间来执行,甚至会执行失败。不过这点并不用太过担心,因为大多数时候都不会有需求要对大数据集进行paixu用户可以...

2019-06-12 20:11:02 10826

原创 Hive零基础从入门到实战 入门篇(十五) HiveQL:聚合函数、GROUP BY语句、HAVING语句

目录前言1. 聚合函数2. GROUP BY语句2.1 去重2.2 与聚合函数一起使用2.2.1count(*)2.2.2count(col)2.2.3count(distinct col)2.2.4 sum(col)2.2.5 avg(col)2.2.6 min(col)2.2.7 max(col)2.2.8 GROUP BY字...

2019-06-05 20:22:47 13827

原创 Hive零基础从入门到实战 入门篇(十四) HiveQL:WHERE 语句

目录前言1. 基本语法2. 谓词操作符详解3. AND、OR4.LIKE、RLIKE、REGEXP前言SELECT语句用于选取字段,本文我们来介绍用于过滤条件的WHERE语句。两者结合使用可以查找到符合过滤条件的记录。在介绍WHERE语句之前我们已经上文的一个简单例子中使用过它了。之前都是假定大家是见过这样的语句的,现在我们将更多地探讨一些细节。WHER...

2019-06-03 09:23:35 11182 4

原创 Hive零基础从入门到实战 入门篇(十三)HiveQL:SELECT …… FROM …… 语句

目录前言1.查询表中的的内容1.1 Hive严格模式2. limit :限制查询返回行数3. 列四则运算4. 列别名前言本文来介绍HQL中最基础的查询语句:SELECT ……FROM……语句。这部分其实和其他SQL方言的语法并无区别,但也会介绍一些Hive独有的参数设置内容。1.查询表中的的内容查询指定的某一列或某几列,命令如下:SE...

2019-05-29 09:40:59 12859

原创 Hive零基础从入门到实战 入门篇(十二)Hive中的命令运行方式

目录前言1. Hive中的一次使用命令: hive -e2. 执行文件中的Hive命令: hive -f3.在shell脚本中使用hive -e命令前言Hive中的命令运行方式常见的有4种,分别是:直接在命令行界面,也就是CLI上运行脚本 执行一句或多句命令,不进入CLI hive -e "命令" 执行文件中一句或多句...

2019-05-17 09:20:15 11102

原创 Hive零基础从入门到实战 入门篇(十一)在.hiverc文件中配置常用参数

目录前言1. 在~目录创建一个.hiverc文件2. 输入常用命令或参数3. 启动Hive验证是否生效前言在home目录~中创建一个隐藏文件.hiverc,然后在其中配置常用参数或命令,之后Hive每次启动时会自动加载这个文件中的内容。1. 在~目录创建一个.hiverc文件#进入home目录cd#创建.hiverc文件vim .hiver...

2019-05-15 09:02:19 10922

原创 Hive零基础从入门到实战 入门篇(十)HiveQL:将csv文件中的数据导入Hive

目录前言1. 数据装载 Load1.1filepath1.2 LOCAL1.3OVERWRITE1.4 PARTITION1.5 举例前言本文介绍如何将文件中的数据导入Hive表中。1. 数据装载 Load将文件中的数据导入Hive中要使用Load关键字,具体完整语法如下,[ ]中的均为可选项:load data [local...

2019-05-10 09:30:34 11641 2

原创 Hive零基础从入门到实战 入门篇(九)如何高效使用notepad编辑HQL

目录前言1. 安装32位的7.4版本notepad2. 设置背景及字体3. 编辑3.1 复制当前文件路径、文件名3.2 缩进3.3 转换文本大小写3.4 行操作3.5 注释3.6 选择语言3.7 函数自动补齐3.8 空格操作3.9 列操作3.10 常用简单操作4. 查找与替换5. 视图5.1 全屏模式5.2 便签模式...

2019-05-02 16:19:07 13321

原创 Hive零基础从入门到实战 入门篇(八)HiveQL:表操作(下)

目录前言1. 表的重命名2. 重命名字段、数据类型、注释3. 增加列4. 删除、替换列5. 删除分区6. 修改表的存储路径前言本文主要介绍Hive中修改表的操作。1. 表的重命名命令如下:alter table oldname rename to new_name;下面我们将上文中建好的表t_od_use_cnt重命名为t_o...

2019-04-25 09:31:33 11405

原创 Hive零基础从入门到实战 入门篇(七)HiveQL:表操作(上)

目录前言1. 最简单的建表语句2. 查看表结构3. 删除表4. 建表时为字段添加注释5. 建表可选项IF NOT EXITS6.建表可选项 EXTERNAL6.1 内部表6.2 外部表7. 建分区表8. 其余建表可选项9. 查询既有表的建表语句前言熟悉了Hive的库操作后,本文来介绍Hive中的的建表、删表操作。1. 最简单...

2019-04-20 09:57:31 12077

原创 Hive零基础从入门到实战 入门篇(六)HiveQL:数据库操作

目录前言1. 查看Hive中当前有哪些数据库2. 创建数据库3. 通过正则匹配筛选数据库4. 创建同名数据库抛出错误5. 查询数据库属性5.1 普通查询5.2 简略写法5.3 额外查询5.4 如建库时增加备注可在此查看6. 使用数据库7. 显示当前所在数据库8. 删除数据库8.1 普通删除8.2 强制删除前言首先按照入门篇(一)环...

2019-04-12 10:18:18 11140 1

原创 Hive零基础从入门到实战 入门篇(五)Hive常用数据类型

目录前言1. 常用基本数据格式2. 常用的集合数据类型3. Hive和其他SQL的数据格式有何区别4. TIMESTAMP5. 数据类型转换5.1 显式转换5.2 隐式转换前言掌握了前三篇博文的Linux基础操作后,本节我们正式开始Hive的学习,首先来熟悉一下Hive中的常用数据格式。1. 常用基本数据格式数据类型 长度 范围及举...

2019-04-10 13:50:28 11006 5

原创 Hive零基础从入门到实战 入门篇(四)Linux系统简单操作(下)

目录前言3.Shell编程3.1建立一个脚本3.2 Shell命令3.2.1 Unix命令3.2.2管道、重定向3.2.3流程控制4.crontab定时任务4.1 操作命令4.2crontab文件语法4.3 crontab实例前言本文承接上文,继续介绍Linux常用基本操作,上文链接:Linux系统简单操作(中),本文将介绍使用Hive时...

2019-04-09 14:11:20 10765

原创 Hive零基础从入门到实战 入门篇(三)Linux系统简单操作(中)

目录前言2.2文件的基本操作2.2.1 创建文件2.2.2 创建目录2.2.3拷贝文件2.2.4拷贝目录2.2.5 剪切文件(目录)2.2.6删除文件(目录)2.2.7 查看文件2.2.8 编辑文件前言本文将会承接上文,继续介绍linux基本操作命令,上文链接:Linux系统简单操作(上)2.2文件的基本操作2.2.1 创建文...

2019-04-07 18:36:58 11220

原创 Hive零基础从入门到实战 入门篇(二)Linux系统简单操作(上)

目录前言1.初识Linux2.Linux常用命令2.1 访问查看2.1.1 查看当前所在目录路径2.1.2 查看当前目录里有哪些文件2.1.3 查看指定目录里有哪些文件2.1.4 强迫症患者福音:清屏前言因为Hive是安装在Linux系统中,所以本文来介绍一些数据分析师会常用到的Linux基本命令和操作。在实际工作中,我们会通过Xshell远程连接公司机房的...

2019-04-06 16:51:25 11664 1

原创 Hive零基础从入门到实战 入门篇(一)环境搭建

目录前言1.Hive是什么2.Hive学习环境搭建前言作为一个数据分析师,操作Hive提取数据已经成为了一个必备技能,但对数据分析师来说,查询才是做的最多的操作,毕竟使用工具是为了完成分析。所以我认为数据分析师是不需要掌握Hive具体的底层架构、安装运维、甚至是运行原理等知识的,毕竟我们不是运维也不是大数据开发工程师,实际工作中也确实用不到这些知识,所以我总结的知识点主要...

2019-04-05 21:11:23 13580 23

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除