自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

地球人是我哈的博客

12月 11月 10月 09月 07月 06月 05月 04月

原创五.SparkStreaming

E. SparkStreaming一.SparkStreaming概述1. SparkStreaming是什么?Spark Streaming用于流式数据的处理。Spark Streaming支持的数据输入源很多，例如：Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输入后可以用Spark的高度抽象原语如：map、reduce、join、window等进行运算。而结果也能保存在很多地方，如HDFS，数据库等。和Spark基于RDD的概念很相似，Spark Str

2020-06-30 20:25:10 146

原创 Kerberos 与hadoop组件之间的认证问题持续更新

ICMP Port UnreachableCaused by: javax.security.auth.login.LoginException: ICMP Port Unreachable at com.sun.security.auth.module.Krb5LoginModule.attemptAuthentication(Krb5LoginModule.java:808) at com.sun.security.auth.module.Krb5LoginModule.login(Krb5L.

2020-06-30 18:25:31 3423 2

原创三.Spark_RDD(下)

C_Spark_RDD（下）一. RDD中的函数传递1. 传递一个方法package cn.xhjava.spark.rdd.funcationtransmitimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}/** * 在实际开发中我们往往需要自己定义一些对于RDD的操作， * 那么此时需要主要的是，初始化工作是在Driver端进行的，而实际运行程序是在Executor端

2020-06-29 20:47:40 150

原创二.Spark_RDD(上)

B_Spark_RDD（上）一. RDD概述1. 什么是RDDRDD（Resilient DistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象。代码中是一个抽象类，它代表一个不可变、可分区、里面的元素可并行计算的集合。2. RDD的属性一组分区（Partition），即数据集的基本组成单位一个计算每个分区的函数RDD之间的依赖关系一个Partitioner，即RDD的分片函数一个列表，存储存放每个Partition的优先位置3. RDD的特点RD

2020-06-29 20:45:41 136

原创一.Spark基本介绍

A_Spark基本介绍一.Spark历史所以，Yarn问世了，Yarn由ResourceManager和NodeManager组成ResourceManager(RM)的主要作用处理客户端的请求(Spark-submit提交job)监控NodeManager(监控节点状态)启动或监控ApplicationMaster，每一个运行在yarn上的程序，都存在一个ApplicationMaster，只是该AM是随机在任意一个NodeManager上创建的资源的分配与调度NodeManag

2020-06-29 20:20:16 590

原创 hudi-hive-sync

hudi-hive-syncSyncing to Hive 有两种方式:在hudi 写时同步使用run_sync_tool.sh 脚本进行同步1. 代码同步val spark = SparkSession .builder() .config(sparkConf) .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer") .getOrCreate()

2020-06-02 11:26:02 4326

centos 7 安装bbc.zip

centos 上安装bbc所需依赖

2021-07-21

elastic-search.zip

elastic-search

2021-07-12

kubernets 二进制包安装所需资源

kubernets 二进制包安装所需资源

2021-07-02

etcd 集群部署包 TLS.tar.gz

k8s etcd 集群部署包

2021-06-29

gitlab-ce-13.10.2-ce.0.el7.x86_64.rpm

gitlab rpm 安装包

2021-06-21

prometheus + grafana 监控所需文件

spark_prometheus_metrics.json

2021-01-04

MySQL--5.6.22-1.el6.i686.rpm.zip

适用于Linux上数据库安装,RPM安装包 MySQL是一种关系数据库管理系统，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。与其他的大型数据库 LAMP LAMP 例如 Oracle、DB2、SQL Server等相比，MySQL [1] 自有它的不足之处，但是这丝毫也没有减少它受欢迎的程度。对于一般的个人使用者和中小型企业来说，MySQL提供的功能已经绰绰有余，而且由于 MySQL是开放源码软件，因此可以大大降低总体拥有成本。

2019-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

地球人是我哈 CSDN认证博客专家 CSDN认证企业博客

码龄5年

IP 属地：湖北省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

57: 原创

8万+: 周排名

3万+: 总排名

6万+: 访问

: 等级

882: 积分

51: 粉丝

41: 获赞

25: 评论

151: 收藏

私信

关注

热门文章

分类专栏

融创 1篇
Kubernetes 2篇
Jvm
hadoop 7篇
kerberos 2篇
kudu 5篇
kafka 2篇
Spark 10篇
Flink 5篇
Hudi 3篇
java 3篇
Linux 5篇
java 设计模式 4篇

最新评论

Flink是如何实现Exactly Once
m0_61906169: 每个subtask都是协调者吗
Flink On k8s
地球人是我哈: flink-pod-template
Flink On k8s
YueBanWa: flink-templeta.yaml 这个你在哪儿配置了？
Hadoop、Hive On k8s
地球人是我哈: 你这个应该是pod的log日志吧，可以进pod里面手动执行 $HADOOP_HOME/sbin/hadoop-daemon.sh start namenode，具体错误看看/opt/hadoop/logs 目录下的日志
Hadoop、Hive On k8s
dk我巍: 大佬，我用您的脚本，namenode启动不了呀问题如下： WARNING: Use of this script to start HDFS daemons is deprecated. WARNING: Attempting to execute replacement "hdfs --daemon start" instead. WARNING: HADOOP_NAMENODE_OPTS has been replaced by HDFS_NAMENODE_OPTS. Using value of HADOOP_NAMENODE_OPTS. WARNING: /opt/hadoop/logs does not exist. Creating.

最新文章

提示

确定要删除当前文章？

取消删除