自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (10)
  • 收藏
  • 关注

翻译 [Spark版本更新]--2.1.2发行说明

2017年10月09日,Spark官方进行了一次小版本升级。相关的发行说明如下:一、子任务[ SPARK-21083 ] - 分析空表后存储零大小和行数二、修复的Bug[ SPARK- 12717] - 使用多个线程时,pyspark广播失败[ SPARK-16251 ] - LocalCheckpointSuite的丢失的检查点块失败,信息消息是片状的。[ SPARK-16625 ] - Ora...

2017-10-31 11:47:55 878

原创 [Java排序算法]--堆排序 (Heap Sort)

前言      最近遇到一个求解TopN的场景,从1亿条数据中,找出最大或者最小的10个数。    怎么办?不可能对数据进行全排序吧,哪里有那么大的内存空间!谷歌搜索了相关的解决方案,最终定位在使用堆排序解决这个问题。 摘要     1、什么是二叉树?     2、什么是堆?     3、堆排序原理?     4、堆排序的Java实现。     5、堆排序的Sc...

2017-10-31 10:17:11 2842

转载 [Spark调优]--TaskSetManager的有效Locality Levels

原文:https://www.jianshu.com/p/05034a9c8cae基于spark-1.5.0测试在Spark Application Web UI的 Stages tag 上,我们可以看到这个的表格,描述的是某个 stage 的 tasks 的一些信息,其中 Locality Level 一栏的值可以有 PROCESS_LOCAL、NODE_LOCAL、NO_PREF、RACK_L...

2017-10-26 16:32:17 525

原创 [CDH基础]--所有主机列表中的平均负载含义

前言      在CDH运维过程中,常常会考虑机器的负载情况,这样有助于判断设备的健康情况,CDH的管理也会使用Linux的命令检查平均负载,那么怎么去查找呢?     本文就简单介绍下平均负载的含义。内容(1)Linux系统平均负载3个数字的含义。    1)查看平均负载的命令       在Linux shell下,有很多命令可以看到Load Average,例如:       root@Sl...

2017-10-19 13:39:57 1973

翻译 [CDH FAQ]--常见问答

原文:https://www.cloudera.com/documentation/enterprise/5-8-x/topics/cm_faqs.html#concept_zd5_ywy_4jCloudera Manager 5常见问题解答本指南介绍有关Cloudera Manager的常见问题解答。继续阅读:·        一般的问题o    Cloudera Manager 5的新功能是什...

2017-10-18 16:37:56 1031

原创 [Scala基础]--类型转换(String to Double 、Long、Float和Int)

前言: 关于Scala的类型转换方式有许多种,但初学时仍会忽略一些重要细节,比如异常情况的捕获等等。 那么本文将简单介绍Scala的String进行相关的类型转换,供大家学习参考。主要内容: 1、Scala的富包装器:富操作和富类列表 2、Scala的隐式转换的目的 通过隐式转换,程序员可以在...

2017-10-18 11:57:27 52876 1

原创 [CDH启动组件报错UNKNOW]--zookeeper或者其他组件重启出错

一、情景:当CDH集群初次启动后,过了一段时间,然后再重启其中组件时,不能启动,cm界面报Unknow错误。二、错误信息:      UNKNOW三、分析:      1、了解cloudera manager的工作原理      2、判断是哪个工作流程出问题      3、查看cloudera agent和zookeeper的日志四、解决方法:      重启组件所在的cloudera agent...

2017-10-17 15:52:04 1966

原创 [Java定时器]--定时器举例

一、定时器是什么?答:顾名思义即是用于定时执行任务而设定。二、Java有几种定时器?答:有常用的4种Java定时器三、举例说明环境:jdk-1.7+idea16+centos-6.8代码:package com.test.java.Thread;import java.util.Calendar;import java.util.Date;import java.util.Timer;i...

2017-10-11 16:08:38 1684

数据仓库需求模板下载excel

1、需求变更申请单模版 2、数据仓库业务需求模板

2023-03-21

Canal开源产品介绍

早期,阿里巴巴B2B公司因为存在杭州和美国 双机房部署,存在跨机房同步的业务需求,当时 早期的数据库同步业务,主要是基于trigger的方式 获取增量变更。 从2010年开始,阿里系公司开始逐步的尝试基 于数据库的日志解析,获取增量变更进行同步, 由此衍生出了增量订阅&消费的业务,从此开启 了一段新纪元.

2018-08-23

window10的wget包

解压后,进入cmd命令行输入wget url即可使用。 举例:wget http://www.baidu.com

2017-12-13

redis-笔记

redis学习笔记

2016-08-31

cloudera-enterprise-datasheet.pdf

cloudera-enterprise-datasheet.pdf(企业和免费版区别)

2016-08-15

数据库性能调优.原理与技术.pdf

数据库性能调优.原理与技术.pdf

2016-08-14

spark论文原文:EECS-2014-12.pdf

伯克利大学spark论文原文:EECS-2014-12.pdf

2016-08-07

bigBench.pdf

Evaluating Hive and Spark SQL with BigBench

2016-08-07

Scala Cookbook

Scala Cookbook - Recipes for Object-Oriented and Functional Programming_Alvin Alexander_2013

2016-08-07

文件hibernate

hibernate-mapping.dtd

2015-04-28

oracle架包

这是一个连接oracle数据库的连接架包哈

2015-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除