• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • 置顶Spark SQL 源码分析系列文章

      Spark SQL 源码分析系列文章,从整个SQL执行流程到各个环节的关键组件,以及Catalyst框架的讲解。

      原创
      2014-07-29 09:46:46
      20763
      1
    • Hive中跑MapReduce Job出现OOM问题分析及解决

      一、引子今天在跑一段很复杂而且涉及数据量10年的N个表join的长SQL时,发生了OOM的异常。由于一个map通常配置只有64MB或者128MB,则在Map阶段出现OOM的情况很少见。所以一般发生在r...

      原创
      2014-11-21 20:02:47
      10136
      0
    • Hive中reduce个数设定

      Hive中reduce个数设定原理解析

      原创
      2014-06-24 14:46:30
      5792
      1
    • Hive数据翻倍总结

      1. 本来8千万的数据和8千万的数据一下join后,变成了30亿。。 2.

      原创
      2014-05-23 18:53:56
      2043
      1
    • Lateral View用法 与 Hive UDTF explode

      Lateral View是Hive中提供给UDTF的conjunction,它可以解决UDTF不能添加额外的select列的问题。 1

      原创
      2014-05-16 19:11:26
      10314
      1
    • Hive导入sequencefile错误

      原因: 自己上传的微

      原创
      2014-04-09 18:18:44
      3282
      0
    • hiveUDAF求中位数

      第一次写UDAF,拿中位数来练手。 看下中位数定义: MEDIAN 中位数(一组数据按从小到大的顺序依次排列,处在中间位置的一个数或最中间两个数据的平均数) 写成genericUDAF的形式 1...

      原创
      2014-04-03 13:15:05
      4351
      1
    • 查找hive中的视图

      有一个需求,让找出hive中的所有视图。 hive没有直接的命令来查看这个表是否是视图还是普通表。 cd $HIVE_HOME/conf/ more hive-site.xml 假设我...

      原创
      2014-03-27 15:34:16
      1640
      0
    • hive求页面访问路径

      曾今在论坛上看到一个这样的题: 有一张很大的表:TRLOG该表大概有2T左右 TRLOG: CREATE TABLE TRLOG (PLATFORM string, USER_ID int, C...

      原创
      2014-03-27 15:11:17
      1374
      0
  • 学院
  • 下载
  • 消息