自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据学习成长之路

从hadoop基础学习到hive、sqoop、oozie、Hbase、spark等的框架实战应用。

  • 博客(8)
  • 资源 (7)
  • 收藏
  • 关注

原创 Hive的UDF编程

官方地址:https://cwiki.apache.org/confluence/display/Hive/HivePlugins什么是UDF(user-Define-Function)?用户定义的函数。查看hive自带的函数。show funtion;查询某个函数的详细使用手册desc function extended split ; UDF几种类型UDF(User-Defined-Func...

2018-03-08 17:56:20 229

原创 Hive中order by、sort by、distribute by和cluster by

Order By语法colOrder: ( ASC | DESC )colNullOrder: (NULLS FIRST | NULLS LAST) -- (Note: Available in Hive 2.1.0 and later)orderBy: ORDER BY colName colOrder? colNullOrder? (',' colName colOrd...

2018-03-08 16:55:52 405

原创 Hive中数据导入导出(Import和Export)

官方文档地址:https://cwiki.apache.org/confluence/display/Hive/Home导出EXPORT将hive表中的数据导出到外部。语法:EXPORT TABLE tablename [PARTITION (part_column="value"[, ...])] TO 'export_target_path' [ FOR replication('even...

2018-03-08 11:59:13 7271

原创 大数据||Hive中常用的查询

Hive中的查询 Select查询语法SELECT [ALL | DISTINCT] select_expr, select_expr, ...  FROM table_reference  [WHERE where_condition]  [GROUP BY col_list]  [ORDER BY col_list]  [CLUSTER BY col_list    | [DISTRIBUTE...

2018-03-07 00:15:45 17558 2

原创 大数据||导出Hive表中的数据

导出Hive表中的数据方式由很多种。一下就介绍一下方式一:在hive的命令行内insert overwrite local directory '/opt/datas/hive_emp_exp' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY '\n' select * from em...

2018-03-06 23:25:37 1638

原创 Hive的管理表和外部表

管理表内部表也称之为MANAGED_TABLE;默认存储在/user/hive/warehouse下,也可以通过location指定;删除表时,会删除表数据以及元数据;外部表外部表称之为EXTERNAL_TABLE;在创建表时可以自己指定目录位置(LOCATION);删除表时,只会删除元数据不会删除表数据;语法外部表创建外部表create external table if not exists ...

2018-03-06 22:53:02 707

原创 Hive中分区表及陷阱

分区表分区表实际就是对应hdfs文件系统上的的独立的文件夹,该文件是夹下是该分区所有数据文件。分区可以理解为分类,通过分类把不同类型的数据放到不同的目录下。分类的标准就是分区字段,可以一个,也可以多个。分区表的意义在于优化查询。查询时尽量利用分区字段。如果不使用分区字段,就会全部扫描。在查询是通过where子句查询来指定所需的分区。样例create external table if not ex...

2018-03-06 22:52:08 7927

原创 导入数据到hive表中的6种方式

数据导入六种方式1、加载本地文件到hive表语法2、加载hdfs文件到hive中3、加载数据覆盖表中已有的数据4、创建表时通过select加载create table if not exists default.dept_catsas select * from dept;5、创建表通过insert加载6、创建表的时候通过location指定加载外部表方式create external table...

2018-03-06 22:42:54 30954 1

OSB安装部署.doc

OSB安装部署步骤详细

2019-07-09

powerdesigner 16.5破解文件

绿色版powerdesigner 16.5破解文件,找了好久百度文件都失效了。

2018-05-21

netcatnetcatnetcat

netcat-0.7.1-1.i386 telnet-0.17-48.el6.x86_64 telnet-server-0.17-48.el6.x86_64 xinetd-2.3.14-40.el6.x86_64

2018-03-22

svn插件site-1.8.22.zip

myeclipse elicsep 插件。插件版本 site-1.8.22.zip 。插件信息描述(site-1.8.22.zip 稳定 markphip 于 2013年5月31日 星期五,12:40:25 16.79 mB ) 使用方法:1、解压zip包 2、把features 和plugins下的文件copy到eclpse安装目录下的对应文件夹下。

2017-09-30

文件在线预览系统

1、首先安装openoffice 配置环境变量 2、安装swftools配置环境变量。 3、通过 FileService 对上传的doc ppt xls pdf png文件进行转换。 4、通过flaxpaper进行在线预览

2014-08-12

OpenOffice 4 不同操作系统兼容性启动命令

OpenOffice 4 不同操作系统兼容性启动命令。 升级版本启动命令。 之前缺少主引导,现在添加主引导。可支持window xp 、win7 等操作系统。

2014-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除