自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 oh-my-zsh 安装(不需要git和root)

公司服务器上没法用git,很多教程都是基于git的方式安装的zsh和oh-my-zsh,看了下各个教程发现git好像不是必须的,尝试了一下好像真的成功了

2020-07-28 14:52:02 554

原创 spark merge文件

刚开始使用spark第一个功能就是合并两个文件,相比于python的pandas合并两个文件,spark在速度上快了不少,而且几乎不在乎文件大小,最大尝试过150G文件大小的merge,而对于pandas而言超过10G的文件已经就无法处理了,使用spark处理文件已经成了刚需。使用spark合并两个文件比较简单,只不过使用过程中发现了不少的坑,主要分为以下几个步骤读取文件var df = spark.read.option("delimiter",delimiter).option("heade

2020-07-13 16:09:28 1541

原创 spark环境创建

spark版本2.3.0创建获取session环境要想操作spark集群,必须获取相应的session环境,具体的spark基本概念见spark技术原理透视在spark中获取 session环境的方法比较简单,代码相对固定private val conf = new SparkConf().setMaster("local")//.set("spark.num.executors","3").set("spark.executor.cores","1")private val sessi

2020-07-13 15:41:08 184

原创 spark备忘

简介整理了一些常用的spark功能备忘,非新手教程,只记录了一些常用功能备查。各功能点比较零散

2020-07-13 14:49:51 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除