自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 有状态的sparkStreaming

1、mapWithState案例:是wordCount小程序,单词word持续增加,由5增加到100了,还会持续增加,因为用到了它的前置数据。必须checkPoint。 ssc.checkpoint("hdfs://linux-hadoop01.ibeifeng.com:8020/beifeng/spark/streaming/chkdir45254")def mappingFun...

2019-06-20 08:01:22 254

转载 spark shuffle总结

一、未经优化的HashShuffleManagershuffle write:stage结束之后,每个task处理的数据按key进行“分类”数据先写入内存缓冲区缓冲区满,溢出到磁盘文件最终,相同key被写入同一个磁盘文件创建的磁盘文件数量 = 当前stagetask数量 * 下一个stage的task数量shuffle read:从上游stage的所有task节点上拉取属于...

2019-06-19 16:22:13 784

转载 git 回滚 commit 的近几次版本

问题:我们在使用git本地commit时,如果commit了好多次没有push,又想把最后一次或者最近几次commit的不想push了,可以用下面的方法撤销(推荐使用第一种)。注意:git 只能撤销最后一次或者最后多次的commit,不能只撤销中间的某一次!!!解决办法:(1)最方便,不需要commit_id:使用命令 gitreset--hardhead~1...

2019-06-17 19:45:32 1210

原创 Scala的闭包和柯里化

1、scala中的闭包:变量不在函数作用域中时,还可以访问。闭包可以作为变量或者返回值def mulBy(factor:Double) = (x:Double) => factor * x      //开始调用      val tripe = mulBy(3)      val half = mulBy(0.5)      println(tripe(14) + " ...

2019-06-15 16:04:32 1886

原创 Scala之Option、Some、None

Scala鼓励你在变量和函数返回值可能不会引用任何值的时候使用Option类型。在没有值的时候,使用None,这是一个对象。如果有值可以引用,就使用Some来包含这个值。Some也是Option的子类。刚接触Scala时就很奇怪, 为什么Java已经有null了,却偏偏还要弄出个None后来依然我行我素在Scala里使用null, 结果就是经常被NullPointerExcep...

2019-06-14 09:29:47 1653

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除