自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 资源 (1)
  • 收藏
  • 关注

原创 快速排序

快速排序

2019-07-21 16:03:18 220

原创 二分查找算法

二分查找算法

2019-07-21 16:02:06 255

原创 Flume监控 Monitor

Flume监控 Monitor

2019-07-10 17:16:58 496

原创 hdfs 小文件处理

hdfs小文件处理spark 采用 Coalesce 进行合并小文件

2019-07-02 18:07:27 318

原创 HBase简单介绍

概述HBase是一个构建在hdfs之上的分布式的的Nosql数据库HBase适合对于海量数据进行实时随机读写HBase一张表能够支撑数十亿行,数百万列HBase从设计上来说由三部分构成 HBase Master :负责处理region分配 DDL 操作 Region-server : 数据读写 底层数据存储和集群协同交给 hdfs 和 zookeeper进行管理数据模型思维数据...

2019-06-20 10:31:58 251

原创 通过Intellij IDEA也可以导本地jar包到本地仓库的

通过Intellij IDEA也可以导本地jar包到本地仓库的

2019-06-19 20:34:51 1570

原创 scp 指定端口映射传文件

scp -P 21822 -r CDH-5.12.0-1.cdh5.12.0.p0.29-el7.parcel root@ip:/root/

2019-06-18 11:33:34 1761

原创 CDH5.12.0安装部署

CDH5.12.0安装部署

2019-06-17 17:07:28 607

原创 cdh Hbase安装部署

cdh Hbase安装部署

2019-06-13 06:32:16 3324

原创 CentOS7下Elasticsearch-6.6.2安装部署

CentOS7下Elasticsearch-6.6.2安装部署下载wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.6.2.tar.gz解压tar -zxvf elasticsearch-6.2.4.tar.gz配置ymlelasticsearch.ymlcluste...

2019-06-04 22:49:48 517

原创 CentOS7下Kibana-6.6.2安装部署

CentOS7下Kibana-6.6.2安装部署下载wget https://artifacts.elastic.co/downloads/kibana/kibana-6.6.2-linux-x86_64.tar.gz解压tar -zxvf kibana-6.6.2-linux-x86_64.tar.gz编辑文件kibana.ymlserver.port: 5601server....

2019-06-04 22:25:49 910

原创 maxwell安装部署

maxwell 解析 mysql binlog日志 实时传入kafka

2019-05-29 17:09:29 1691

原创 CDH版 Phoenix 安装以及简单使用

CDH版 Phoenix 安装以及简单使用

2019-05-28 17:14:22 1148 4

原创 Hive PredicatePushDown (谓词下推)

Hive PredicatePushDown (谓词下推)

2019-05-28 14:46:33 869

原创 flume avro sink

ink端的memory channel的capacity和transactionCapacity一定要设置的比source的大,否则会报错,如下 ERROR flume.SinkRunner: Unable to deliver event. Exception follows.org.apache.flume.EventDeliveryException: Failed to send events at org.apache.flume.sink.AbstractRpcSink.proces

2019-05-27 14:47:51 2619

原创 flume配置 离线hdfs实时kafka

flume数据数据 一路到hdfs 供离线分析,一路经kafka消息中间件 配置案例

2019-05-27 11:35:21 207

原创 maven 添加resource打包

maven 添加resource打包

2019-05-26 19:34:25 2923

原创 Spark调优指南(四)-内存管理

Spark调优指南(四)-内存管理

2019-05-19 13:43:26 380

原创 Spark调优指南(三)-调整数据结构

Spark调优指南(三)-调整数据结构

2019-05-19 11:01:17 158

原创 Spark调优指南(二)-内存调优

Spark调优指南(二)-内存调优调整数据接接结构,减少内存占用

2019-05-19 10:57:27 308

原创 Spark 调优指南(一)-数据序列化

java.io.NotSerializableException:Spark 调优指南 之序列化Kryo

2019-05-19 10:39:11 477

原创 Spark repartition VS coalesce

Spark repartition VS coalesce

2019-05-16 09:18:37 325 1

原创 Spark 算子 reduceByKey vs groupByKey 对比

Spark 算子 reduceByKey vs groupByKey 对比

2019-05-15 15:54:48 303

原创 Spark common join vs map join

Spark common join 对比 map join

2019-05-14 15:34:28 600

原创 Spark-广播变量(Broadcast Variables)

Spark-广播变量(Broadcast Variables)使用以及源码分析

2019-05-14 14:14:52 1538

原创 Spark 算子- Actions

Spark 算子- Actions

2019-05-12 17:41:46 119

原创 Spark 算子-Transformations

Spark 算子 Transformations

2019-05-12 17:06:13 200

原创 spark join的几种方式以及subtract intersection cartesian 区别

spark join的几种方式subtract intersection cartesian 区别1. join2. leftOuterJoin3. fullOuterJoin4. rightOuterJoina.subtract(b).collect()a.intersection(b).collect()a.cartesian(b).collect()

2019-05-08 14:40:32 721

原创 sc.parallelize 获得的RDD分区是怎么划分的

sc.parallelize 获得的RDD分区是怎么划分的

2019-05-08 13:48:02 7119

原创 yarn的架构设计

yarn 架构设计,job的执行流程

2019-05-04 22:55:29 311

原创 SparkConf SparkContext 的简单介绍

SparkConf SparkContext 源码简单介绍

2019-05-02 15:07:45 1922

原创 Shell $0, $#, $*, $@, $?, $$的含义

$0当前脚本的文件名$n传递给脚本或函数的参数。n 是一个数字,表示第几个参数。例如,第一个参数是$1,第二个参数是$2。$#传递给脚本或函数的参数个数。$*传递给脚本或函数的所有参数。$@传递给脚本或函数的所有参数。$* 和 $@ 都表示传递给函数或脚本的所有参数,不被双引号(" “)包含时,都以”$1" “2"…"2" ...

2019-05-01 23:20:15 73648 8

原创 spark RDD 详解

spark RDD 通过看官网+源码进行总结

2019-05-01 18:46:54 358

原创 scala入门系列(十一) 模式匹配 match 偏函数 PartialFunction

/** * 模式匹配(值/类型) * 异常处理 */object MatchApp { def main(args: Array[String]): Unit = { val matchs = Array(60,70,80,90) val value = matchs(Random.nextInt(matchs.length)) value match {...

2019-05-01 09:30:16 343

原创 scala入门系列(十) - implicit 隐式转换

/** * 隐式转换 implicit * 偷偷为一个类的方法进行增强 * java proxy *//** * rdd rddparifunction */object ImolicitApp { def main(args: Array[String]): Unit = { implicit def man2supman(man:Man):Superm...

2019-04-30 15:17:32 151

原创 scala入门系列(九) - apply

object ApplyApp {def main(args: Array[String]): Unit = {// for (i <-1 to 10){// ApplyTest.add// }// println(ApplyTest.count)// ApplyTest.static// val a = new ApplyTest//...

2019-04-30 15:12:38 95

原创 scala入门系列(八) case class

object CaseClassApp {def main(args: Array[String]): Unit = {// val user=User(“s”)val user=new User(“s”)user(“b”)println(user(“b”).name)println(user.name)}}//case class 不用new apply 表面不new...

2019-04-30 15:06:57 155

原创 scala入门系列(七) String常见用法

字符串常见用法object StringApp { def main(args: Array[String]): Unit = { val str = "aaa" println("str:"+str) //字符串插值 println(s"str:$str") val multiLines= """ |ss ...

2019-04-30 15:01:27 204

原创 scala入门系列(六) - 集合 Array Map List

arrayobject ArrayApp { def main(args: Array[String]): Unit = { //定长 val str = new Array[String](5) println(str.length)//5 //println(str.toString) //mkstring val b = Ar...

2019-04-30 14:58:20 275

原创 scala入门系列(三) - 函数 map filter left right flod flatten flatmap

object FunApp { def main(args: Array[String]): Unit = { val l = List(1,2,3,4,5,6,7,8) val l2 = l.map(x=>x*2) println(l2) val l3 = l.map(_*2) println(l3) val l4 = l.map(_*2...

2019-04-30 14:36:12 313

win hadoop 开发文件

win 10 下 idea 搭建hadoop开发环境需要得开发包,已经本地环境变量配置

2019-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除