雾幻
码龄9年
关注
提问 私信
  • 博客:489,420
    社区:154
    489,574
    总访问量
  • 104
    原创
  • 2,286,880
    排名
  • 104
    粉丝
  • 0
    铁粉

个人简介:种一棵树最好的时间是十年前,而后是现在

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2016-03-01
博客简介:

雾幻的博客

查看详细资料
个人成就
  • 获得212次点赞
  • 内容获得38次评论
  • 获得706次收藏
  • 代码片获得261次分享
创作历程
  • 11篇
    2019年
  • 70篇
    2018年
  • 25篇
    2017年
  • 8篇
    2016年
成就勋章
TA的专栏
  • html
    8篇
  • css
    6篇
  • python
    8篇
  • java
    17篇
  • hadoop
    36篇
  • hive
    1篇
  • 数据结构与算法
    9篇
  • 设计模式
    2篇
  • spark
    8篇
  • linux
    4篇
  • ScalaTest
    8篇
  • Flink
    7篇
  • 基准测试
  • kerberos
    4篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

SparkStreaming读写kerberos Hive(Yarn Cluster)

yarn Cluster模式也可适用于从集群外部提交(接口机)提交命令spark-submit的最后一行为args参数,经多次尝试发现yarn cluster模式通过该方式传入kerberos文件可行krb5.conf需要在yarn集群所有节点相同位置放置client.keytab需要在命令提交节点,yarn集群所有节点相同位置放置,container连接HDFS[kerber...
原创
发布博客 2019.05.15 ·
3125 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

SparkStreaming读写kerberos HBase(Yarn Cluster)

yarn Cluster模式也可适用于从集群外部提交(接口机)提交命令spark-submit的最后一行为args参数,经多次尝试发现yarn cluster模式通过该方式传入kerberos文件可行krb5.conf需要在yarn集群所有节点相同位置放置client.keytab需要在命令提交节点,yarn集群所有节点相同位置放置,container连接HDFS[kerber...
原创
发布博客 2019.05.15 ·
1546 阅读 ·
2 点赞 ·
2 评论 ·
2 收藏

SparkStreaming读写kerberos HDFS(Yarn Cluster)

yarn Cluster模式也可适用于从集群外部提交(接口机)提交命令spark-submit的最后一行为args参数,经多次尝试发现yarn cluster模式通过该方式传入kerberos文件可行krb5.conf需要在yarn集群所有节点相同位置放置client.keytab需要在命令提交节点,yarn集群所有节点相同位置放置,container连接HDFS[kerber...
原创
发布博客 2019.05.15 ·
1978 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

SparkStreaming读写kerberos Kafka(Yarn Client、Yarn Cluster)

1
原创
发布博客 2019.05.15 ·
2271 阅读 ·
1 点赞 ·
1 评论 ·
10 收藏

Flink编程模型

4.1 抽象的层级有状态的数据流处理层。最底层的抽象仅仅提供有状态的数据流,它通过处理函数(Process Function)嵌入到数据流api(DataStream API). 用户可以通过它自由的处理单流或者多流,并保持一致性和容错。同时用户可以注册事件时间和处理时间的回调处理,以实现复杂的计算逻辑。核心API层,DataSet 处理有界的数据集,DataStream 处理有界或者无界的...
原创
发布博客 2019.04.24 ·
886 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Flink核心组件

Flink系统的架构与Spark类似,是一个基于Master-Slave风格的架构。可以支持本地的快速迭代,以及一些环形的迭代任务。并且 Flink 可以定制化内存管理。在这点,如果要对比 Flink 和 Spark 的话,Flink 并没有将内存完全交给应用层。这也是为什么 Spark 相对于 Flink,更容易出现 OOM的原因(out of memory)。就框架本身与应用场景来说,Flin...
原创
发布博客 2019.04.24 ·
4389 阅读 ·
2 点赞 ·
0 评论 ·
11 收藏

Flink分层架构

2.1 Flink结构与支持Flink是一个分层架构的系统,不同层的栈建立在其下层基础上,并且每一层所包含的组件都提供了特定的抽象,用来服务于上层组件。Flink分层的组件栈如下图所示(从下至上):部署:Flink 支持本地运行、能在独立集群或者在被 YARN 或 Mesos 管理的集群上运行, 也能部署在云上。运行:Flink 的核心是分布式流式数据引擎,意味着数据以一次一个事件的形式...
原创
发布博客 2019.04.24 ·
1792 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

Flink简介

1.1 Flink的引入这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热或多或少的掩盖了其他分布式计算的系统身影。就像 Flink,也就在这个时候默默的发展着。在国外一些社区,有很多人将大数据的计算引擎分成...
原创
发布博客 2019.04.24 ·
889 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Spark大数据处理:技术、应用与性能优化

发布资源 2019.01.23 ·
rar

Flink高可用集群搭建

一、部署说明flink是apache一款大数据实时计算应用,在生产环境中,用来实时计算应用产生的日志,数据等,满足预警,入库等需求二、系统环境系统版本:centos 7.2java版本: jdk 1.8.0_161zookeeper版本: zookeeper-3.4.9hadoop版本: Hadoop-2.8.3.tar.gzflink版本: flink-1.7.1四个机器,其中1...
原创
发布博客 2019.01.23 ·
2738 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

从PAXOS到ZOOKEEPER分布式一致性原理与实践

发布资源 2019.01.23 ·
rar

Kafka技术内幕:图文详解Kafka源码设计与实现

发布资源 2019.01.23 ·
rar

hadoop技术内幕三件套

发布资源 2019.01.23 ·
rar

Apache Kylin权威指南

发布资源 2019.01.23 ·
zip

MySQL5.7从入门到精通

发布资源 2019.01.23 ·
zip

flink on yarn运行异常NoClassDefFoundError: com/sun/jersey/api/client/config/ClientConfig

flink on yarn模式在运行时发生如下异常信息18/08/25 17:29:28 WARN ObjectStore: Version information not found in metastore. hive.metastore.schema.verification is not enabled so recording the schema version 1.2.018/0...
原创
发布博客 2019.01.22 ·
3711 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Flink安装与运行——flink on yarn

Flink下载地址:https://flink.apache.org/downloads.html因目前Flink尚未集成hadoop2.9版本,因此选择2.7稳定版进行安装(兼容)以下操作请在集群的所有节点进行解压重命名$ tar -zxvf flink-1.7.1-bin-hadoop27-scala_2.11.tgz /opt/beh/core $ mv flink-1.7.1...
原创
发布博客 2019.01.22 ·
14465 阅读 ·
4 点赞 ·
0 评论 ·
18 收藏

flink依赖jar包——解决NoClassDefFoundError: com/sun/jersey

发布资源 2019.01.22 ·
zip

Flink基础教程

发布资源 2019.01.22 ·
zip

Spark大数据实例开发教程-书签-完整版

发布资源 2019.01.22 ·
zip
加载更多