自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

韩利鹏

大数据云计算,算法

  • 博客(3)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 SPARK提交job的几种模式

spark常见的提交方式,有local的,有yarn-client,yarn-cluster等,下面来具体的介绍怎么写提交的脚本

2017-10-31 11:52:43 2543

原创 spark性能调优都有哪些方法

1、常规性能调优:分配资源、并行度。。。等2、JVM调优(Java虚拟机):JVM相关的参数,通常情况下,如果你的硬件配置、基础的JVM的配置,都ok的话,JVM通常不会造成太严重的性能问题;反而更多的是,在troubleshooting中,JVM占了很重要的地位;JVM造成线上的spark作业的运行报错,甚至失败(比如OOM)。3、shuffle调优(相当重要):spark在执行grou

2017-10-30 15:24:15 1408

原创 flume通过公网ip采集到hdfs上

需求描述: 公司的服务器在不同的地市都有分布,需要把不同地方的服务器的日志文件都收集到公司的内网hadoop集群中,来进行分析,(公司的hadoop集群和其他地方的集群不在同一内网中,需要借助公网来进行传输) 简单的模型图如下 失败案例: 直接把公网IP放在了hadoop集群的nn(namenode上面),模型如下: 然后启动flume往hdfs上面传输日志文件,发现flume端一直抛

2017-10-09 13:36:52 1743 2

mongodb-Linux版本

linux平台的mongodb版本是3.2.18.tgz,可以直接解压使用,想不要资源分的,但是选择不了,尴尬

2017-12-04

scala源码-2.11.x.zip

scala源码2.11.x,是学习scala,查看源码的必备东西,拿走不谢,本来是不要分的,可是不能不选,就少选点吧。

2017-11-03

SQLyog Enterprise_jb51.net.zip

能够对对数据库进行可视化的操作,内涵破解工具,简单好用

2016-10-12

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除