自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (8)
  • 收藏
  • 关注

原创 Spark On Yarn 部署与配置

开始安装部署spark1. 编辑 spark-env.sh我的配置:export SPARK_HOME=/home/hadoop/spark-2.4.3-bin-hadoop2.7export SCALA_HOME=/usr/local/scala-2.11.8export JAVA_HOME=/usr/local/javaexport HADOOP_HOME=/home/hadoop...

2019-07-30 13:45:24 5182 2

原创 用arthas神器来诊断HBase异常进程

1. 异常突起HBase集群的某一个RegionServer的CPU使用率突然飙升到百分之百,单独重启该RegionServer之后,CPU的负载依旧会逐渐攀上顶峰。多次重启集群之后,CPU满载的现象依然会复现,且会持续居高不下,慢慢地该RegionServer就会宕掉,慢慢地HBase集群就完犊子了。2. 异常之上的现象CDH监控页面来看,除CPU之外的几乎所有核心指标都是正常的,磁盘和网络IO都很低,内存更是充足,压缩队列,刷新队列也是正常的。普罗米修斯的监控也是类似这样的,就不贴图了。监控

2021-07-18 20:53:19 295 1

原创 开源工具 _ HBase表管理系统——HBaseManager2.0.6

1. 更新预览在HBaseManager 2.0.6 版本中,主要集成了Kerberos认证以及初步支持HQL的功能。快速体验站点:http://www.jielongping.com:9527/index 账户密码:admin/admin1232. Kerberos认证如果你的HBase集群集成了Kerberos,那么你需要在配置文件hbase-manager.properties中,为HBaseManager配置Kerberos相关的认证,我的配置示例如下:hbase.manager.zk

2021-07-18 20:52:50 1076

原创 从源码层面分析HBase的请求队列参数

1. 背景在用arthas神器来诊断hbase异常进程这篇文章中,我详细地记录了一起生产环境中使用HBase的事故,事故发生的大致起因是,一个异常scan导致CPU使用率飙升至百分之百,且巨高不下,从而导致整个集群宕机。虽然,借助于arthas这个神器,我们很轻易地就定位到了是scan的问题。而且事后,我们在业务层面上也采取了很多的优化手段。但是对于这个罪魁祸首,却一直没有找到一个完美的解决方案,总不能让业务那边一用scan就战战兢兢,如履薄冰吧。在上篇文章的最后,靠着匮乏的多线程功底,对于scan这

2021-07-18 20:52:19 293 2

原创 ZGC初体验——OpenJdk 15编译HBase 1.4.8

文章目录ZGC初体验——OpenJdk 15编译HBase 1.4.81. 前言2. G13. ZGC4. 用AdoptOpenJDK15重编译hbase-1.4.84.1 JDK15在滴滴HBase上的应用4.2 准备工作4.3 项目配置4.4 处理sun.misc.Unsafe not found异常4.5 替换javax.xml.ws.http.HTTPException4.6 程序包javax.annotation不存在4.7 程序包com.sun.javadoc不存在4.8升级jetty4.9 提

2021-07-18 20:51:48 423 1

原创 HBase运维篇 _ ZGC初体验——HBase1.4.8安装部署和测试

文章目录HBase运维篇 | ZGC初体验——HBase1.4.8安装部署和测试1. 摘要2. 开始安装2.1 准备工作2.2 安装部署3. 测试4. 补充一个编译时遇到的异常5. 总结6. 附件HBase运维篇 | ZGC初体验——HBase1.4.8安装部署和测试1. 摘要接上篇文章——HBase源码篇 | ZGC初体验——OpenJdk 15编译HBase 1.4.8,在上篇文章中,我为大家分享了open jdk 15编译hbase-1.4.8的详细过程,并且也得到了最终可安装的tar.gz包。

2021-07-18 20:51:18 249 1

原创 HBase源码篇 _ 记一次HBase高版本JDK兼容性排错

1. 为什么要预分区一张表被首次创建时,只会分配一个region给这个表。因此,在刚刚开始时,所有读写请求都会落在这个region所在的region server上,而不管你整个集群有多少个region server。不能充分地利用集群的分布式特性。2. 最为常见的建表语句create 'leo_test1',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'HexStringSplit'}create 'leo_test2'

2021-07-18 20:50:43 267 1

原创 HBase预分区和rowkey设计优化

1. 为什么要预分区一张表被首次创建时,只会分配一个region给这个表。因此,在刚刚开始时,所有读写请求都会落在这个region所在的region server上,而不管你整个集群有多少个region server。不能充分地利用集群的分布式特性。2. 最为常见的建表语句create 'leo_test1',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'HexStringSplit'}create 'leo_test2'

2021-07-18 20:48:25 141

原创 HBase异常分析

WALs中server文件出现重复 -splitting后缀https://blog.csdn.net/liu16659/article/details/80960323https://issues.apache.org/jira/browse/HBASE-14729%E3%80%91%E3%80%82%E6%9F%A5%E7%9C%8BHDFS%E7%9A%84HBase%E7%9A%84%E8%A1%A8%E7%9B%AE%E5%BD%95%E5%A6%82%E4%B8%8B%EF%BC%9A这.

2021-07-17 13:05:47 153 1

原创 HBase探索篇 _ 单节点多RegionServer部署与性能测试

目录导读文章目录目录导读1. 引言2. 合理的Region数量3. Region数量优化3.1提高RegionServer的堆内存3.2 单节点多Region Server的部署4. 单RS、多RS、单RS大堆集群环境的YCSB压测数据对比5. 总结6. 参考链接1. 引言随着集群中总的Region数持续增长,每个节点平均管理的Region数已达550左右,某些大表的写入流量一上来,Region Server就会不堪重负,相继挂掉。在HBase中,Region的一个列族对应一个MemStore,通常

2021-07-17 13:04:10 973

原创 HBase探索篇 _ ZGC和G1在HBase集群之中的GC性能对比

文章目录1. 前言2. GC之痛3. CMS和G1停顿时间瓶颈4. ZGC 原理4.1 全并发的ZGC4.2 ZGC中的关键技术5. 初探ZGC在HBase中的GC表现6. ZGC与G1 GC的数据统计对比6.1 G16.2 ZGC6.3 G1与ZGC吞吐量相关指标比较7. 总结8. 参考链接1. 前言本文为了衔接公众号中的前几篇ZGC相关的文章,继续探索ZGC在HBase集群中真实的GC表现能力,并把其与G1 GC做一个简单的对比,验证ZGC是否真如传言中的那般,令人叹为观止。在前几篇文章中,我为大

2021-07-17 13:02:35 357

原创 HBase探索篇 _ OpenJdk15编译并部署CDH版HBase

文章目录1. 前言2. 准备工作3. 项目配置3.1 项目导入3.2 编译配置3.3 程序包javax.annotation不存在3.4 maven-shade-plugin升级版本3.5 程序包javax.xml.ws.http不存在3.6 Some Enforcer rules have failed.3.7 hbase-spark模块编译报错3.8 处理一些编译时的警告信息4. 本地启动和功能测试4.1 HMaster Application配置4.2 localhost/unresolved:218

2021-07-17 13:01:22 482

原创 HBase实践篇 _ 为HBase的ThriftAPI设计连接池

文章目录1. 摘要2. commons-pool22.1 GenericObjectPool2.2 PooledObjectFactory接口2.3 BasePooledObjectFactory类2.4 GenericKeyedObjectPool带Key的对象池2.5 GenericObjectPoolConfig参数配置类3. HBase Thrift 客户端连接池的实现3.1 连接池核心实现类的UML图3.2 快速使用4. 把连接池的功能再包装成一个单例服务5. 总结6. 参考链接1. 摘要客户

2021-07-17 12:53:07 752

原创 HBase开发篇 _ 一文说清HBase Connection的使用

目录导读文章目录目录导读1. 引言2. 单例模式维护HBase的Connection3. 多例模式中维护HBase的Connection4. ConnectionFactory.createConnection方法中的连接池参数5. 总结1. 引言对于很多初次接触HBase的伙伴,在使用其客户端API来构建Connection连接对象的时候,有可能会陷入以下几个误区。类比druid等mysql数据库连接池,自己封装一个Connection对象的资源池,每次使用都从池中取出一个Connection对

2021-07-17 12:51:48 531

原创 hbase教程

这里写自定义目录标题欢迎使用Markdown编辑器HBase 教程HBase 快速启动Apache HBase配置文件HBase 基础条件HBase 运行模式HBase 开始运行HBase 默认配置HBase 配置示例Base 重要配置HBase 动态配置HBase 版本号和兼容性HBase 回滚:版本恢复HBase 升级路径使用Apache HBase ShellHBase shell 技巧HBase 数据模型HBase 概念视图HBase 物理视图HBase 命名空间HBase 表、行与列族HBase

2021-07-17 12:44:25 534

原创 HBase服务高可用之路的探索

文章目录HBase服务高可用之路的探索一、背景二、HBase熔断API目前已实现的功能三、关于熔断四、借鉴HBase熔断切换在有赞团队内的实践五、熔断在我们的HBase接口服务中的应用六、HBase熔断工作的流程图七、滚动计数RollingNumber1. 滚动计数的概念八、深入理解熔断在我们HBase接口服务中的工作机制1. HBase熔断机制工作的核心参数读写阈值判定的配置示例核心参数解读2. 判断接口是否健康的策略判断当前接口是否健康的详细策略错误阈值说明3. 健康检查九、总结HBase服务高可用之

2021-07-17 12:18:04 197

原创 hbase-sdk

hbase-sdk基于hbase-client的相关API开发而来的一款轻量级的HBase ORM框架。 ????hbase-sdk分为spring-boot-starter-hbase和hbase-sdk-core两部分。SpringBoot项目中引入spring-boot-starter-hbase,在普通的Java项目中可以使用hbase-sdk-core。???? 快速开始 |???? 视频教程 |???? 官方文档 |???? 捐赠我们 |???? English

2021-07-17 12:10:30 383 1

原创 HBase2.0的修复工具HBCK2

1. 背景在了解HBCK2之前,建议先了解一下啥是HBCK。HBCK是HBase1.x中的命令,到了HBase2.x中,HBCK命令不适用,且它的写功能(-fix)已删除,它虽然还可以报告HBase2.x集群的状态,但是由于它不了解HBase2.x集群内部的工作原理,因此其评估将不准确。因此,如果你正在使用HBase2.x,那么对HBCK2应该需要了解一些,即使你不经常用到。2. 获取HBCK2HBCK2已经被剥离出HBase成为了一个单独的项目,如果你想要使用这个工具,需要根据自己HBase的版本,

2021-07-17 11:53:28 1480 4

原创 死磕spark中的job、stage、task

写在前面台风夜的电话面试里被问到了spark运行任务的过程中stage的划分依据。一下子就给整懵了,支支吾吾答非所问。从事大数据的开发也有一年半光景,spark任务的运行原理依旧知之甚少。因此就参阅各种优秀的文章,再配上一个自己工作中的实际项目,特意整理出这篇笔记,以此警示自己的自大与无知。测试环境本地开发环境idea 2019.1.2maven 3.6spark 2.4.3sca...

2019-08-14 22:19:38 1498

原创 Docker中安装MySql5.7

Docker中MySQL5.7的安装步骤1. 下载镜像docker pull mysql:5.72. 宿主机创建MySQL所需目录# 数据保存目录mkdir -p /home/leo/docker-data/mysql/data/# 日志保存目录mkdir -p /home/leo/docker-data/mysql/logs/# 配置文件mkdir -p /home/leo/...

2019-07-30 13:52:35 329

原创 Centos7上安装Docker

参考文档菜鸟教程-Docker教程Centos7上安装docker安装步骤Docker从1.13版本之后采用时间线的方式作为版本号,分为社区版CE和企业版EE。社区版是免费提供给个人开发者和小型团体使用的,企业版会提供额外的收费服务,比如经过官方测试认证过的基础设施、容器、插件等。社区版按照stable和edge两种方式发布,每个季度更新stable版本,如17.06,17.09;...

2019-07-30 13:51:57 334

原创 用maven编译、打包Java和Scala混合开发的项目

写在前面摆脱依赖IDEA手动打jar包,实现maven管理spark\scala的不同版本的依赖,排除特定依赖,包含指定依赖,并最终生成包含Java、Scala代码的混合编译的可执行jar包程序。使用环境jdk1.8maven3.6.1IDEA2017spark-2.4.3scala2.1.8我的pom文件<?xml version="1.0" encoding="...

2019-07-30 13:51:08 1694

原创 用idea开发我们的spark项目

写在前面如果你是刚入行的java(或大数据)菜鸟,如果你还不会使用idea这样的“神兵利器”,如果你还对 mvn clean package 这样的命令一知半解。那么,你有必要花点时间,瞧一瞧这篇文章,正所谓,“工欲善其事,必先利其器”,它将指导你一步一步用idea开发出我们的spark程序,用maven编译打包我们的Scala(Scala与Java混合)代码。当然,大神请自动忽略。开发环境...

2019-07-30 13:49:20 561

原创 CDH6.2.0安装、踩坑实录

写在前面官方资料ClouderaManager下载地址https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPMS/x86_64/managerCDH6.2.0安装包地址:https://archive.cloudera.com/cdh6/6.2.0/parcels/由于我们的操作系统为CentOS7,需要下载以下文件:parcels...

2019-07-30 13:48:17 3037

原创 Flink高可用集群搭建

部署flink的准备工作flink版本的选择需要考虑hadoop的版本,本集群hadoop的版本为2.7.4,flink的版本为flink-1.7.2-bin-hadoop27-scala_2.11.tgzflink高可用集群需要依赖zookeeper开始安装1. 编辑flink的配置文件 flink-conf.yaml# 这里选择配置主节点jobmanager.rpc.addre...

2019-07-30 13:47:07 719 1

原创 Kafka集群部署与配置

开始安装配置Kafaka1. 编辑server.properties文件############################# Server Basics ############################## The id of the broker. This must be set to a unique integer for each broker.broker....

2019-07-30 13:46:20 446 1

原创 Hive的安装与配置

安装与配置hive安装hive之前需要到官网查询hive与Hadoop版本的兼容性。这里我所选的hive和Hadoop的版本如下:hadoop-2.7.4hive-2.3.51. 编辑hive的环境变量2. 编辑 hive-env.sh 文件# The heap size of the jvm stared by hive shell script can be controlle...

2019-07-30 13:44:23 417 1

原创 Hbase高可用集群搭建

集群资源与角色规划node1node2node3node4node5zookeeperzookeeperzookeepernn1nn2datanodedatanodedatanodedatanodedatanodejournaljournaljournalrm1rm2nodemanagernodem...

2019-07-30 13:43:21 384 1

原创 Hadoop高可用集群搭建

集群资源与角色规划node1node2node3node4node5zookeeperzookeeperzookeepernn1nn2datanodedatanodedatanodedatanodedatanodejournaljournaljournalrm1rm2nodemanagernodem...

2019-07-30 13:42:02 349

原创 Hadoop集群搭建前的准备工作

一、硬件环境集群由五个虚拟机节点组成,每个虚拟机节点的配置如下:操作系统:CentOS 7 (64 位)CPU 6 core内存 16G硬盘 800G二、网络环境主机名和IP规划主机名ipnode1192.168.124.101node2192.168.124.102node3192.168.124.103node4192.168....

2019-07-30 13:38:11 761 1

jamon-dist-2013.12.28.zip

hbase源码调试的时候,需要用它生成hbase-server模块的jamon模版代码,其官网需要翻墙

2020-06-01

hadoop集群搭建所需软件包.txt

Hadoop及其生态圈搭建所需的一整套安装包,包括,zookeeper-3.4.13.tar.gz,spark-2.4.3-bin-hadoop2.7.tgz,scala-2.11.8.tgz,Python-3.6.4.tgz,mysql-connector-java-5.1.34.jar,kafka_2.11-2.1.0.tgz,jdk-8u144-linux-x64.tar.gz,hbase-2.1.3-bin.tar.gz,hadoop-3.1.2.tar.gz,hadoop-2.7.4.tar.gz,flink-1.7.2-bin-hadoop27-scala_2.11.tgz,apache-hive-3.1.1-bin.tar.gz,apache-hive-2.3.5-bin.tar.gz,以及一些推荐的集群搭建配置文件,包括hdfs-site.xml、hive-site.xml等等

2019-07-30

CDH6.2.0最全安装包

CDH6.2.0最全安装包,包括管理服务以及客户端软件,还包括mysql5.7的安装包。

2019-04-07

hadoop-2.7.4.tar.gz

hadoop2.7.4.tar.gz稳定开发版,安装包。易安装易使用。学习大数据的必须之选。适用用平台centos7...........

2017-09-19

apache-tomcat-9.0.0.M22-windows-x64.zip

apache-tomcat-9 安装包

2017-08-22

apache-maven-3.5.0.rar

maven 3.5.0

2017-08-22

robomongo-0.9.0-rc8-windows-x86_64-c113244

Mongodb 可视化工具

2017-08-22

mongodb-linux-x86_64-rhel70-3.4.7.tgz

MongoDb Linux64 3.4.7 稳定版

2017-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除