自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (11)
  • 收藏
  • 关注

原创 order by 排序HiveSQL

工作时常会有根据某个或某几个字段的值大小进行排序的需求,hive sql 同sql一样支持多个字段进行升降序排序,其中各个字段之间用逗号进行分割,当未注明desc(降序)还是asc(升序)时默认的是进行升序排序。下文以两个字段为例进行笔记记录。1) order by column1,column2;--未注明,则两个字段都是进行升序,即先按column1进行升序排序,当column1的值相同的时候,则继续按column2的值进行升序排序显示。2) order by column1,column2 d

2021-01-17 10:34:00 2300

原创 left join on 筛选与where筛选的比较

join on后面也能进行条件筛选,where后面也能加条件进行筛选,但两者的结果是不一样的。下面通过实际数据案例来说明问题。数据准备:建表与写入数据A 表hive >create table tempTableAzw(id int,name string ,grade int ,dept int ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|';hive >load data local inpath '/data0/VR.

2021-01-16 23:07:03 2216

原创 explode与lateral view解析 hive

工作中看代码时遇到lateral view explode(split(sni_type,',')) snTable as sni_info ,初看挺一脸懵逼的,细查之后才明白是对字段sni_type进行分割之后,将分割后中的元素值转换为了多行。具体:split()函数split()函数用于分割数据。语法格式为split(str,sep) ,参数str为字符串类型的字段,sep为分割符(支持正则),结果返回一个数组array。如上面split(sni_type,',') ,假设字段sni_typ..

2021-01-16 12:02:24 383

原创 Hive 函数学习总结1(数学统计、字符串处理函数)

在处理数据时,完全可以借助hive 本身就已经自带的多种功能强大的函数,在拉数据的时候就同时进行了处理,不需要再傻傻的拉到本地再借助python去处理了。本文结合参考文献,将自己工作中遇到过的部分函数记录下来,进行简单介绍与用作备忘。(在不知道有哪些函数的时候,可以通过hive -e "show functions ;"查看里面有的函数。目录数学统计类函数字符串函数1、字符串长度函数:length2、分割字符串函数: split ****3、带分隔符字符串连接函数:concat_ws

2021-01-15 22:25:34 1492

原创 查询某一个特征(字段)的取值种类有多少(去重)

hive sql 中,查询某个字段的取值总共有多少个类别,只需要count一下即可,但需要注意加distinct.如查询表中符合条件的uuid总共有多少个类别(独立不重复的uuid 有多少)-- 独立的uuid总数select count(distinct(uuid))from bigTable0111zwwhere cre_mod in ('tianyi_npagev', 'tianyi_nspagev') and sni_info='7';-- 结果输出 5993distin

2021-01-15 20:06:04 7590

原创 hive 数据写入

hive表中数据的写入主要有 insert into(overwrite) values 、 insert ... select 、 load 、 create table as select ... dataTable 这几种方式。其中hive从0.14版本开始支持 insert into table values (line data)的形式。创建/查看/使用/删除 数据库建表的方式从头建表和从已有表中建表-- 方式一 从头建表此表drop table if exists zw;.

2021-01-12 23:51:21 4605

python总结-原dell.xmind

关于Python的总结思维导图笔记

2021-06-07

第9章数据聚合与分组运算.xmind

《利用python进行数据分析 》的第9章数据聚合与分组运算思维导图笔记

2021-06-07

第8章绘图可视化.xmind

《利用python进行数据分析》的第8章绘图可视化的思维导图笔记

2021-06-07

第7章数据规整化:清理转化合并和重塑.xmind

《利用python进行数据分析》的第7章数据规整化 的思维导图笔记

2021-06-07

第6章数据加载、存储与文件格式.xmind

第6章数据加载、存储与文件格式 的思维导图笔记

2021-06-07

第5章pandas入门.xmind

利用Python进行数据分析第5章pandas入门的思维导图

2021-06-07

第4章Numpy基础:数组和矢量计算.xmind

Numpy基础:数组和矢量计算.xmind的思维导图原图

2021-06-07

Numpy基础:数组和矢量计算-笔记与代码ch04Self.ipynb

Numpy基础:数组和矢量计算-笔记与代码 对应代码

2021-06-07

封装库PCB下载

这是一个常用的PCB封装库,可以给大家画PCB图的时候作为工具使用

2015-01-26

AD的最全分类最细的视频教程

AD10破解版的AD10的视频教程,别再被那些美其名为自学网站的地方所坑了!分享让我们更快的成长和开心

2015-01-22

64位的win7系统破解版的AD10的免费和无广告注册下载,另外附有安装详解

64位win7破解版的AD10的免费和无广告注册下载,另外附有安装详解和视频教程,别再被那些美其名为自学网站的地方所坑了!分享让我们更快的成长和开心

2015-01-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除