自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 CDH Manager API 操作Yarn资源池

CDH Manager API 操作Yarn 资源池版本说明:CDH 5.11.0API版本:v161 API 权限认证在使用REST API 访问 CDH Manager 提供的相关接口的时候,需要进行权限认证。认证的类型是 Basic Auth。在java编程中将如下所示生成authorization,然后将该认证信息添加到请求头信息中即可。private static Stri...

2018-12-22 17:16:27 3551

原创 HBase单机伪分布式安装

HBase单机伪分布式安装版本说明:hadoop-2.7.6zookeeper-3.4.13hbase-2.1.01 下载安装包官网地址:http://hbase.apache.org/downloads.html1.1 下载安装包在官网下载相应版本的安装包,这里下载的是hbase-2.1.0版本。wget http://mirror.bit.edu.cn/apache/hb...

2018-12-22 17:13:41 788

原创 Elasticsearch与Kibana部署及使用

Elasticsearch与Kibana部署及使用安装环境Mac OS 适用于Linux版本说明Elasticsearch:6.4.0Kibana:6.4.01 Elasticsearch部署及使用官网:https://www.elastic.co/1.1 下载Elasticsearch下载地址:https://www.elastic.co/downloads/elast...

2018-12-22 17:13:17 1919

原创 CentOS7下yum安装MariaDB与简单配置

CentOS7下yum安装MariaDB与简单配置开始之前要确保已经安装yum并且配置好相关的源。一、 安装命令:yum -y install mariadb mariadb-server二、启动MariaDBsystemctl start mariadb三、 设置开机启动systemctl enable mariadb四、相关配置mysql_secure_installa...

2018-12-22 17:11:00 482

原创 Python基于单例模式实现具有时效性的内存缓存

Python基于单例模式实现具有时效性的内存缓存版本说明:Python 2.7Python有不少第三方的缓存库,如cacheout、memcached等。因为项目需求,这里不使用第三方库,自己实现具有时效性的内存缓存,用来缓存重复利用的数据。1 设计实现1.1 思路采用dict()作为缓存介质,数据以key、value的形式进行保存。key为cache_id,用来标识不同的缓存数据。...

2018-12-22 16:55:01 1552 1

原创 Spark读写Elasticsearch

Spark读写Elasticsearch版本说明Spark:2.3.1Elasticsearch: elasticsearch-6.4.01 Scala环境下Spark读写Elasticsearch1.1 依赖包1.1.1 Spark依赖<dependency> <groupId>org.apache.spark</groupId> ...

2018-12-22 16:54:15 6018

原创 SparkStreaming 解析Kafka JSON格式数据

SparkStreaming 解析Kafka JSON格式数据项目记录:在项目中,SparkStreaming整合Kafka时,通常Kafka发送的数据是以JSON字符串形式发送的,这里总结了五种SparkStreaming解析Kafka中JSON格式数据并转为DataFrame进行数据分析的方法。需求:将如下JSON格式的数据转成如下所示的DataFrame1 使用Python脚...

2018-12-22 16:53:25 24496 22

原创 SparkStreaming 读写Kafka

Spark/Streaming 读写Kafka版本说明kafka:2.12-2.0.0spark:<spark.version>2.3.0</spark.version>scala依赖包:<dependency> <groupId>org.apache.spark</groupId> <artifa...

2018-12-22 16:52:56 912

原创 SparkSQL数据源操作

SparkSQL数据源操作版本说明: spark-2.3.0SparkSQL支持很多数据源,我们可以使用Spark内置的数据源,目前Spark支持的数据源有:json,parquet,jdbc,orc,libsvm,csv,text。也可以指定自定义的数据源,只需要在读取数据源的时候,指定数据源的全名。在https://spark-packages.org/这个网站,我们可以获取到更多的第...

2018-12-22 16:51:52 785

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除