博客专栏  >  云计算/大数据   >  Hive之翼

Hive之翼

学习分享Hive知识。

关注
9 已关注
14篇博文
  • Hive优化策略

    hive优化目标在有限的资源下,执行效率高。 常见问题 数据倾斜、Map数设置、Reduce数设置等hive执行 查看执行计划explain [extended] hql样例explain sel...

    2015-07-22 09:47
    1933
  • Hive自定义函数(UDF、UDAF)

    当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数。UDF用户自定义函数(user defined function)–针对单条记录。 创建函数流程 1、自定义一...

    2015-07-21 23:12
    8344
  • Hive常见内置函数及其使用

    函数分类HIVE CLI命令显示当前会话有多少函数可用 SHOW FUNCTIONS;显示函数的描述信息 DESC FUNCTION concat;显示函数的扩展描述信息 DESC FUNCTI...

    2015-07-21 21:34
    2469
  • Hive高级查询(group by、 order by、 join等)

    查询操作group by、 order by、 join 、 distribute by、 sort by、 clusrer by、 union all底层的实现 mapreduce常见的聚合操作c...

    2015-07-19 22:43
    5806
  • Hive的表属性操作

    修改表名alter table table_name rename to new_table_name增加列alter table tablename add columns(c1 string co...

    2015-07-18 18:05
    2454
  • Hive动态分区

    动态分区指不需要为不同的分区添加不同的插入语句,分区不确定,需要从数据中获取。相关参数设置set hive.exec.dynamic.partition=true; //使用动态分区 (可通过这个语句...

    2015-07-18 18:14
    2849
  • Hive数据导出

    Hadoop命令的方式:get、texthive> dfs -get /user/hive/warehouse/testtable/* /liguodong/dataimport; hive> !ls...

    2015-07-17 23:19
    1289
  • Hive数据加载(内部表,外部表,分区表)

    内表数据加载创建表时加载create table newtable as select col1,col2 from oldtablehive> create table testNew as sel...

    2015-07-17 21:49
    8572
  • Hive Cilent数据操作

    Hive执行命令方式有cli,jdbc,hwi,beeline,而我们常用的往往是cli shell 操作。cli shellhive -help hive --help注:命令脚本必须在集群的节点或...

    2015-07-15 22:24
    843
  • Hive分区表与分桶

    分区表在Hive Select查询中,一般会扫描整个表内容,会消耗很多时间做没必要的工作。 分区表指的是在创建表时,指定partition的分区空间。分区语法 create table tabl...

    2015-07-15 18:07
    5383
  • Hive不同文件的读取与序列化

    Hive不同文件的读取对比stored as textfile直接查看hdfs hadoop fs -texthive> create table test_txt(name string,val ...

    2015-07-15 16:37
    1571
  • Hive命令行常用操作(数据库操作,表操作)

    数据库操作查看所有的数据库 hive> show databases ; 使用数据库default hive> use default; 查看数据库信息 hive > describe ...

    2015-07-14 22:48
    10180
  • Hive数据类型与文件存储格式

    Hive数据类型基础数据类型:TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DECIMAL,CHAR...

    2015-07-14 10:37
    1224
  • Hive简述及几种访问方式

    what is hive? Hive 是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据的提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop 中...

    2015-07-13 16:26
    2296

img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部