自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 性能优化

spark core部分一:Spark性能优化核心基石1,Spark是采用Master-slaves的模式进行资源管理和任务执行的管理:      a) 资源管理:Master-Workers,在一台机器上可以有多个Workers;      b) 任务执行:Driver-Executors,当在一台机器上分配多个Workers的时候,那么默认情况下每个Worker都会为当前运行的

2016-07-25 10:01:40 975

原创 shuffle

一,到底什么事Shuffle?       Shuffle中文翻译为“洗牌”,需要Shuffle的关键性原因是某种具有共同特征的数据需要最终汇聚到一个计算节点上进行计算。二,Shuffle可能面临的问题?运行Task的时候才会产生Shuffle(Shuffle已经融化在Spark的算子中了)。1,数据量非常大;2,数据如何分类,即如何Partition,Hash、Sort、钨丝计划

2016-07-18 10:16:15 814

原创 spark 评估指标

评估指标1 Classification model evaluation1.1 二元分类       1.1.1阈值调整1.2 Multiclassclassification       1.2.1 Label based metrics1.3 Muitilabel classification1.4 Ranking systems2 Regression mo

2016-07-16 16:06:03 6755

原创 sparkStreaming_电商案例

数据生成:package com.java__SparkStreaming;import kafka.javaapi.producer.Producer;import kafka.producer.KeyedMessage;import kafka.producer.ProducerConfig;import java.util.*;/** * Created by Ad

2016-07-12 10:02:45 2263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除