張萠飛
码龄8年
关注
提问 私信
  • 博客:464,413
    464,413
    总访问量
  • 77
    原创
  • 17,604
    排名
  • 135
    粉丝
  • 1
    铁粉

个人简介:运营商行业,大数据集群一线运维工程师

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2017-07-20
博客简介:

主要写大数据集群一线运维和学习工作经验

博客描述:
IaaS、PaaS运维
查看详细资料
  • 原力等级
    当前等级
    3
    当前总分
    473
    当月
    1
个人成就
  • 获得200次点赞
  • 内容获得39次评论
  • 获得1,263次收藏
  • 代码片获得1,002次分享
创作历程
  • 1篇
    2024年
  • 1篇
    2023年
  • 6篇
    2022年
  • 61篇
    2020年
  • 91篇
    2019年
  • 13篇
    2018年
  • 1篇
    2017年
成就勋章
TA的专栏
  • Solr
  • Linux
    16篇
  • Ambari
    2篇
  • Tez
    1篇
  • Scala
    1篇
  • Nginx
    2篇
  • Spark
    23篇
  • ES
    1篇
  • Spring
    2篇
  • Storm
    1篇
  • 大数据算法
    1篇
  • Datax
    1篇
  • Sqoop
    1篇
  • Flink
    41篇
  • Flink DataStreaming API
    10篇
  • Flink DataSet API
    1篇
  • Flink Table API & SQL
    4篇
  • Flink Deployment
    3篇
  • Hive
    18篇
  • Kafka
    10篇
  • Hbase
    12篇
  • Java
    13篇
  • MySQL
    1篇
  • Zookeeper
  • YARN
    8篇
  • Redis
    4篇
  • 实时计算
    5篇
  • HDFS
    14篇
  • ANTLR4
    1篇
  • IDEA
    6篇
  • Layui
    1篇
  • CDH
    4篇
  • 数据湖
    2篇
  • Kubernetes
  • Pulsar
    2篇
兴趣领域 设置
  • 大数据
    hadoophivestormsparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

记一次hdfs集群上传变慢问题核查

hdfs上传变慢原因分析和解决
原创
发布博客 2024.10.28 ·
565 阅读 ·
12 点赞 ·
0 评论 ·
17 收藏

Hudi入门:Spark集成使用Hudi

官网部署文档翻译
翻译
发布博客 2023.07.06 ·
1388 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

记一次Spark 提交任务执行缓慢之问题解决了

hive 分区字段没有用引号括起来,导致hive或spark sql类型的任务执行时间很长
原创
发布博客 2022.09.02 ·
1636 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

Hadoop: Capacity Scheduler yarn容量调度

本文描述了 CapacityScheduler,这是一种可插拔的 Hadoop 调度器,它允许多租户安全地共享一个大型集群,从而在分配容量的限制下及时为其应用程序分配资源。
翻译
发布博客 2022.08.15 ·
1391 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Linux 命令使用笔记【mapstat】

cpu 监控命令,报告处理器相关的统计数据。
原创
发布博客 2022.08.12 ·
382 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

YARN Service

Yarn Service 框架提供了一个类拉来支持和 API来在 Yarn 中本地托管长期运行的服务。简而言之,它是一个容器编排平台,用于管理 YARN 上的容器化服务。它既支持 docker 容器,也支持传统的基于进程的容器。该框架的职责包括执行配置解析和挂载、生命周期管理(如停止/启动/删除服务)、伸缩服务组件、在 YARN 上滚动升级服务、监控服务的健康和就绪情况等等。...
翻译
发布博客 2022.08.12 ·
980 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Linux 命令使用笔记【sysctl】

linux sysctl命令修改系统内核配置
原创
发布博客 2022.08.11 ·
1381 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

ssh登录闪退

通过XShell登录主机,从日志看可以登录上,只不过登录成功之后立马闪退,并报权限拒绝。
原创
发布博客 2022.08.11 ·
2208 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

7、Flink Table API & SQL - SQL (DDL/DML)

阅读本章,基于已经阅读了Flink Table API & SQL - 概念和通用API这是Flink中支持的数据定义语言(DDL)和数据操作语言(DML)构造的完整列表。目录查询初始化查询支持的语法操作DDL指定DDL建表PARTITIONED BYWITH OPTIONS删表IF EXISTS数据类型保留关键字查询...
翻译
发布博客 2019.09.10 ·
5736 阅读 ·
3 点赞 ·
1 评论 ·
13 收藏

load average高

load average高查看负载情况命令topuptimew判断负载高问题的命令mapstatmpstat 5 4 每5秒打印1次 CPU 使用情况,一共打印4次%usr: 显示在用户级(应用程序)执行时发生的CPU利用率百分比。 %nice: 显示以优先级较高的用户级别执行时发生的CPU利用率百分比。 %sys: 显示在系统级(内核)执行时发生的CPU利用率百分比。请注意,这不包括维护硬件和软件的时间中断。 %iowait: 显示系统具有未完成磁
原创
发布博客 2020.12.03 ·
671 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

Kafka迭代升级,轮询升级

升级步骤从0.8.x, 0.9.x, 0.10.0.x, 0.10.1.x, 0.10.2.x, 0.11.0.x, 1.0.x, 1.1.x, 2.0.x or 2.1.x or 2.2.x, 2.3.x, 2.4.x 升级到2.5.0如果您正在从2.1.x之前的版本升级。请参阅下面关于用于存储消费者偏移量的模式更改的注释。一旦您更改了 inter.broker.protocol.version 到最新版本时,将不可能降级到2.1之前的版本。滚动升级:1、更新 server.proper.
翻译
发布博客 2020.12.03 ·
2054 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

HDFS 客户端的 Shell 命令

classpathdfsenvvarsfetchdtfsckgetconfgroupshttpfslsSnapshottableDirjmxgetoevoivoiv_legacysnapshotDiffversion
翻译
发布博客 2020.11.21 ·
920 阅读 ·
0 点赞 ·
1 评论 ·
3 收藏

Linux 命令使用笔记【vmstat】

vmstat命令vmstat 命令的含义为显示虚拟内存状态(“Virtual Memory Statistics”),但是它可以报告关于进程、内存、I/O等系统整体运行状态。语法vmstat(选项)(参数)选项-a:显示活动内页; -f:显示启动后创建的进程总数; -m:显示slab信息; -n:头信息仅显示一次; -s:以表格方式显示事件计数器和内存状态; -d:报告磁盘状态; -p:显示指定的硬盘分区状态; -S:输出信息的单位。参数事件间隔:状态信息刷新的.
原创
发布博客 2020.10.13 ·
241 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

HDFS 视图(View Fs)

介绍视图文件系统(ViewFs)提供了一种管理多个Hadoop文件系统名称空间(或名称空间卷)的方法。对于具有多个namenode的集群,因此在HDFS联合中具有多个名称空间,这一点特别有用。ViewFs类似于某些Unix/Linux系统中的客户端挂载表。ViewFs可以用来创建个性化的名称空间视图,也可以创建每个集群的通用视图。...
翻译
发布博客 2020.09.07 ·
1878 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

YARN 客户端命令

概述纱线命令由bin/纱线脚本调用。运行不带任何参数的纱线脚本将打印所有命令的描述。Usage: yarn [SHELL_OPTIONS] COMMAND [GENERIC_OPTIONS] [SUB_COMMAND] [COMMAND_OPTIONS]纱线有一个选项解析框架,它使用解析泛型选项和运行类。COMMAND_OPTIONS Description SHELL_OPTIONS 一组常见的shell选项。这些都记录在命令手册页上。 GENERIC_OPTIONS
翻译
发布博客 2020.09.07 ·
2045 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MapReduce V2 开发手册

目的这个文档全面描述了 Hadoop MapReduce 框架面向用户的所有方面,作为一个教程。前提条件确保 Hadoop 已安装、配置并正在运行。更多的细节: Single Node Setup for first-time users. Cluster Setup for large, distributed clusters. 概述Hadoop MapReduce 是一个软件框架,可以轻松地编写在大型集群(数千个节点)上并行处理大量数据(兆兆字节数据集)的应
翻译
发布博客 2020.09.07 ·
742 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Linux 命令使用笔记【iostat】

iostat命令iostat 命令被用于监视系统输入输出设备和 CPU 的使用情况。它的特点是汇报磁盘活动统计情况,同时也会汇报出 CPU 使用情况。同 vmstat 一样,iostat 也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析。语法iostat(选项)(参数)选项-c:仅显示CPU使用情况; -d:仅显示设备利用率; -k:显示状态以千字节每秒为单位,而不使用块每秒; -m:显示状态以兆字节每秒为单位; -p:仅显示块设备和所有被使用的其他分区
原创
发布博客 2020.09.07 ·
255 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HDP 平台通过 Ambari 的 API 获取 YARN 运行状况

主机上需要安装 jq 用来解析 json 串通过 curl 访问 Ambari API,获取 json 格式的数据curl -u ${username}:${password} -sS -G "${url_base_path}services/YARN/components/RESOURCEMANAGER"获取 resourcemanager 的总数rm_total=`echo $rm_json| jq '.ServiceComponentInfo.total_count'`获取.
原创
发布博客 2020.08.07 ·
862 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

通过访问 YARN 的 API 来获取队列信息

主机上需要安装 jq 用来解析 json 串访问 API,获取 json 数据curl -s --negotiate -u : "$rm:8088/ws/v1/cluster/scheduler"通过 jq 命令来解析队列部分的数据queue_json=`echo $queue_json|jq '.scheduler.schedulerInfo.queues'`获取队列总数量queue_json_size=`echo $queue_json|jq '.queue[]|.q.
原创
发布博客 2020.08.07 ·
2798 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

统计 HDFS 的小文件个数

使用 hdfs oiv 命令解析 namenode fsimage 文件,输入为 , 号分隔的文本文件hdfs oiv -i $fsimage -t /data1/zpf/ops/small_file/tmp/ -o /data1/zpf/ops/small_file/fsimage.txt -p Delimited -delimiter ,在hive上建一个表将数据 put 到 hive 表对应的 hdfs 目录上hadoop fs -put -f /data1/zpf/ops/sma
原创
发布博客 2020.08.07 ·
2721 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏
加载更多