• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • 置顶Spark SQL 源码分析系列文章

      Spark SQL 源码分析系列文章,从整个SQL执行流程到各个环节的关键组件,以及Catalyst框架的讲解。

      原创
      2014-07-29 09:46:46
      20763
      1
    • Apache Helix简介

      Apache HELIX一个为partitioned和replicated分布式资源 而设计的 集群管理框架What is HELIXApache Helix是一个通用的集群资源管理框架,它能被用作自...

      原创
      2015-08-11 10:38:53
      4037
      0
    • HDFS之Node角色

      Secondary NameNode:NameNode是一种logappend方式来存储对dfs的修改操作,editlog。 NameNode启动的时候,会去从fsimage中读取HDFS的状态,然...

      原创
      2015-08-04 16:13:01
      1120
      0
    • LinkedIn Cubert 实践指南

      LinkedIn Cubert安装指南 Understanding Cubert Concepts(一)Partitioned Blocks Understanding Cubert Concepts...

      原创
      2015-07-01 11:25:50
      1310
      0
    • Understanding Cubert Concepts(二)Co-Partitioned Blocks

      Understanding Cubert Concepts(二):Cubert Co-Partitioned Blocks话接上文Cubert PartitionedBlocks,我们介绍了Cuber...

      原创
      2015-07-01 10:54:56
      1538
      0
    • Understanding Cubert Concepts(一)Partitioned Blocks

      Understanding Cubert Concepts:Cubert Concepts对于Cubert,我们要理解其核心的一些概念,比如BLOCK。这些概念也是区别于传统的关系型范式(Pig,Hi...

      原创
      2015-06-29 17:59:16
      1376
      0
    • LinkedIn Cubert安装指南

      最近工作需要,调研了一下LinkedIn开源的用于复杂大数据分析的高性能计算引擎Cubert。自己测了下,感觉比较适合做报表统计中的Cube计算和Join计算,效率往往比Hive高很多倍,节省资源和时...

      原创
      2015-06-18 11:41:31
      2048
      0
    • Build Spark1.3.1 with CDH HADOOP

      Build Spark1.3.1 with CDH HADOOP1、找到CDH的版本[root@web02 spark1.3]# hadoop version Hadoop 2.0.0-cdh4.7....

      原创
      2015-04-20 16:39:53
      2291
      0
    • sbt pom reader - sbt读取pom

      sbt pom reader - sbt读取pomSpark为了依赖项的统一管理用了sbt pom reader这个插件,sbt编译发布也是从pom里读GAV了。 我记得老版本sbt的依赖项是写在pr...

      原创
      2015-04-20 12:05:01
      2093
      0
    • Apache Hadoop NextGen MapReduce (YARN)

      Apache Hadoop NextGen MapReduce (YARN)MRV2的设计是基于分离JobTracker的主要职能,将以下2个职能放在2个单独的进程中,以前都是在一个(JobTrack...

      翻译
      2015-04-17 18:03:04
      1202
      0
    • Spark SQL之External DataSource外部数据源(二)源码分析

      Spark SQL在Spark1.2中提供了External DataSource API,开发者可以根据接口来实现自己的外部数据源,如avro, csv, json, parquet等等。    在...

      原创
      2014-12-22 01:12:30
      8068
      1
  • 学院
  • 下载
  • 消息