自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

houzhizhen的专栏

bigdata hobbyist

  • 博客(11)
  • 资源 (4)
  • 收藏
  • 关注

原创 表格式改为orc之后,对于array类型的数据查询结果不正确 问题排查和解决方案

Description:We create a partitioned text format table with one partition, after we change the format of table to orc, then the array type field may output error.The step to reproduce the result.First

2017-03-30 14:35:24 1329

转载 Hadoop Snappy安装终极教程

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://shitouer.cn/2013/01/hadoop-hbase-snappy-setup-final-tutorial/ 因为产品需要,这两天研究了一下Hadoop Snappy。先不说什么各个压缩算法之间的性能对比,单是这个安装过程,就很痛苦。网上有很多博友写H

2017-03-29 10:38:10 1428

原创 Spark Job Asynchronous Submit Process

private def doOnReceive(event: DAGSchedulerEvent): Unit = event match { case JobSubmitted(jobId, rdd, func, partitions, callSite, listener, properties) => dagScheduler.handleJobSubmitted(jobI

2017-03-29 09:39:29 322

转载 WhereHows 安装

1. 准备1.1. 依赖工具建议使用以下工具对应的版本号,由于版本导致的问题,解决起来怪麻烦的Gradle >= 2.4, 下载链接在 这里 2.14(当前最新发布版)也没问题Play = 2.2.4, 下载链接在 这里 Play的版本兼容做得不好,每次版本升级都会搭配一个升级指南,所以保证版本的问题Java=1.8Mysql >= 5.6,事实上,5.

2017-03-27 15:28:57 7729

原创 The Process of Submitting a Job

When calls the collect of a rdd, it triggers a job./** * Return an array that contains all of the elements in this RDD. * * @note this method should only be used if the resulting array is expe

2017-03-20 17:37:54 306

原创 HadoopRDD getPartitions

HadoopRDDoverride def getPartitions: Array[Partition] = { val jobConf = getJobConf() // add the credentials here as this can be called before SparkContext initialized SparkHadoopUtil.get.ad

2017-03-20 17:01:52 706

原创 Spark Default Partitioner

/** * Choose a partitioner to use for a cogroup-like operation between a number of RDDs. * * If any of the RDDs already has a partitioner, choose that one. * * Otherwise, we use a defaul

2017-03-20 16:28:51 708

原创 UserGroupInformation Source Code Analysis

UserGroupInformation is used in the following way.final UserGroupInformation loginUgi = UserGroupInformation.getLoginUser();The getLoginUser method is simple. public synchronized static UserGroupIn

2017-03-17 15:02:24 658

转载 程序员面试、算法研究、编程艺术、红黑树、数据挖掘5大系列集锦

程序员面试、算法研究、编程艺术、红黑树、数据挖掘5大经典原创系列集锦与总结(七月在线:https://www.julyedu.com/,面试 & 算法 & 机器学习在线课程)作者:July--结构之法算法之道blog之博主。时间:2010年10月-2014年12月。出处:http://blog.csdn.net/v_JULY_v 。说明:本博客中部分

2017-03-08 17:02:00 443

转载 CSDN博客积分规则和获取积分方法

博客积分是衡量博客水平的重要标准,博客的排名也将按照积分排列。积分规则具体如下: 1、每发布一篇原创或者翻译文章:可获得10分 2、每发布一篇转载文章:可获得2分 3、博主的文章每被评论一次:可获得1分 4、每发表一次评论:可获得1分(自己给自己评论、博主回复别人对自己博文的评论不获得积分) 5、每篇博文阅读次数每超过100次:可获得1分,阅读加分最高加到100分,即每篇文章点

2017-03-08 16:50:26 225

转载 JAVA8 十大新特性详解

Java is still not dead—and people are starting to figure that out.” 本教程将用带注释的简单代码来描述新特性,你将看不到大片吓人的文字。一、接口的默认方法Java 8允许我们给接口添加一个非抽象的方法实现,只需要使用 default关键字即可,这个特征又叫做扩展方法,示例如下: 代码如下:interface Formula {

2017-03-02 10:05:00 293

Hive 性能测试程序,https://github.com/hortonworks/hive-testbench 编译

Hive 性能测试程序,https://github.com/hortonworks/hive-testbench 编译

2023-02-24

Tez 的设计者在 Hadoop 大会上的分享

1. Tez 的设计思想和解决的问题。

2022-03-15

Transactional Operations in Apache Hive: Present and Future

Hive 事务设计

2022-03-01

The Log-Structured Merge-Tree (LSM-Tree).pdf

The Log-Structured Merge-Tree (LSM-Tree).pdf

2021-06-22

Distributed cycle detection in large-scale sparse graphs.pdf

分布式大规模环检测的计算方法。In this paper we present a distributed algorithm for detecting cycles in large-scale directed graphs, along with its correctness proof and analysis. The algorithm is then extended to find strong components in directed graphs. We indicate an application to detecting cycles in number theoretic functions such as the proper divisor function. Our prototype implementation of the cycle detection algorithm, when applied to the proper divisor function, detects all sociable groups of numbers (cycles in the proper divisor function) up to 107.

2020-08-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除