博客专栏  >  云计算/大数据   >  勤奋的Hive

勤奋的Hive

Hive学习笔记,使用经验

关注
28 已关注
33篇博文
  • Hive学习之自定义聚合函数

    编写Hive的UDAF函数

    2014-10-07 15:58
    3255
  • Hive学习之连接查询优化(二)

    星型连接增强功能 Hive-0.11.0中优化器的增强功能专注于星型模式配置中连接的有效处理。星型模式连接的初始化工作是受限制的,在该模式中所有维度表在过滤和投影后在同一时间装入内存。一部分维度表装...

    2014-09-22 16:43
    2696
  • Hive学习之连接查询优化(一)

    Hive为连接查询提供了一系列的优化方法,包括优化Hive的查询执行计划以改进连接查询的效率和减少用户提示的使用等。Hive可以自动识别很多用例并自动优化它们,Hive在0.11版本中对下面的情况改进...

    2014-09-22 11:24
    2140
  • Hive学习之抽样(Sampling)

    当数据量特别大时,对全体数据进行处理存在困难时,抽样就显得尤其重要了。抽样可以从被抽取的数据中估计和推断出整体的特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。 Hive...

    2014-09-18 12:59
    6865
  • Hive学习之Union和子查询

    Hive中的Union查询已经使用过多次,但在使用之前都没有系统的学习过Union的语法格式(虽然在使用过程中没有出现过问题),所以现在将这一点补上。Union的语法格式如下:

    2014-09-15 16:17
    7631
  • Hive学习之Lateral View

    Lateral view与UDTF函数如explode()一起使用,UDTF对每个输入行产生0或者多个输出行。Lateral view首先在基表的每个输入行应用UDTF,然后连接结果输出行与输入行组成...

    2014-09-15 10:55
    2370
  • Hive学习之连接查询

    Hive支持连接查询,但有一些条件必须遵守,比如只支持相等查询,其它查询如不等式查询则不支持,还支持外连接,左半连接查询。另外Hive支持多于两个表以上的连接查询。下面为Hive连接查询的语法:

    2014-09-11 14:41
    3642
  • Hive学习之自定义函数(UDF)

    在之前的学习,包括后面的实践和工作中,已经多次使用了Hive的内置函数,即有普通的函数,像cast、lower等,也有聚合函数,比如max,min等,除了这些内置函数,Hive还允许在内置函数不满足业...

    2014-09-09 15:23
    2363
  • Hive学习之内置聚合函数

    聚合函数 下表为Hive内置的聚合函数。 返回类型 函数名 描述 BIGINT count(*) count(expr)...

    2014-08-25 17:19
    10600
  • Hive学习之内置条件和字符串函数

    条件函数 下表为Hive支持的一些条件函数。 返回类型 函数名 描述 T if(boolean testCondition,...

    2014-08-22 10:29
    14927
  • Hive学习之内置数学、日期函数

    数学函数 下面表格中的函数为Hive的内置数学函数,大部分当参数为NULL时返回NULL。 返回类型 函数名 描述 bigint  ...

    2014-08-20 13:54
    5278
  • Hive学习之HiveServer2 JDBC客户端

    HiveServer和HiveServer2都有两种模式,分别为嵌入式和单机服务器模式,对于嵌入式URI为"jdbc:hive://"或者"jdbc:hive2://",单机服务器模式的URI为"jd...

    2014-08-04 11:10
    10035
  • Hive学习之HiveServer2服务端配置与启动

    在之前的学习和实践Hive中,使用的都是CLI或者hive –e的方式,该方式仅允许使用HiveQL执行查询、更新等操作,并且该方式比较笨拙单一。幸好Hive提供了轻客户端的实现,通过HiveServ...

    2014-08-01 13:49
    24715
  • Hive学习之配置Oracle为Metastore及问题

    之前学习了如何配置MySQL做为Hive的Metastore,由于在实际应用环境中统一使用的是Oracle11g,所以需要将MySQL改为Oracle。原本预料只要简单地修改hive-site.xml...

    2014-07-29 11:25
    2947
  • Hive学习之内置操作符

    Hive的内置操作符与很多编程语言中的操作符相似,可以分为关系操作符、算术操作符、逻辑操作符和复合类型操作符,下面进行一一学习。 关系操作符 关系操作符比较操作数并产生TRUE或者FALSE,需要...

    2014-07-25 11:10
    2690
  • Hive学习之Transform/Map-Reduce语法

    使用Hive的用户可以在数据流中插入自定义的Mappers和Reducers,为了运行自定义的Mapper和Reducer脚本,用户可以使用下面的命令,该命令使用TRANSFORM从句嵌入Mapper...

    2014-07-16 15:47
    4100
  • Hive学习之SELECT语句(二)

    ORDER BY从句 Hive中的order by从句与SQL中的order by很相似,都支持ASC和DESC,语法格式如下: ORDER BY colName[ASC|DESC] 但Hive...

    2014-07-08 13:24
    2960
  • Hive学习之SELECT语句(一)

    前面学习了Hive中的数据定义语言,也学习了如何加载或者插入数据,在一些示例中或多或少的使用了SELECT语句,但还没有全面系统地学习,现在就开始学习Hive的SELECT语句。Hive的SELECT...

    2014-07-03 14:19
    3833
  • Hive学习之Load和Insert语句

    Load语句 使用Load语句可以方便的将本地文件系统或者HDFS中的文件加载到Hive表中,语句格式如下: LOAD DATA [LOCAL] INPATH 'filepath' [OVER...

    2014-07-01 16:10
    6889
  • Hive学习之部署UDF的四种方法

    在向Hive添加自定义的UDF或者添加Hive自带的类,如GenericUDFDBOutput时,需要将包含UDF类的Jar包添加到Hive环境中,这样就可以使用Create [temporary]f...

    2014-06-30 15:00
    4798

Nutch-2.X
1081657
Hadoop
49168299
img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部