Spark1.x升级Spark2.x常见异常HBase篇【hbase.rpc.timeout】

最新推荐文章于 2023-04-28 15:03:27 发布

神之凝视

最新推荐文章于 2023-04-28 15:03:27 发布

阅读量571

点赞数 1

分类专栏： HBase Spark 大数据文章标签： hbase

本文链接：https://blog.csdn.net/qq_27600723/article/details/106695219

版权

大数据同时被 3 个专栏收录

74 篇文章 2 订阅

订阅专栏

Spark

46 篇文章 3 订阅

订阅专栏

HBase

3 篇文章 0 订阅

订阅专栏

一.场景分析

大数据环境频繁使用metastore连接HBase加载数据时，偶尔会抛出hbase.rpc.timeout异常导致任务直接失败的情况。
异常信息：

Caused by: org.apache.hadoop.hbase.ipc.CallTimeoutException: Call id=2, waitTime=600020, operationTimeout=600000 expired.
    at org.apache.hadoop.hbase.ipc.Call.checkAndSetTimeout(Call.java:73)
    at org.apache.hadoop.hbase.ipc.RpcClientImpl.call(RpcClientImpl.java:1245)
    ... 13 more

或

org.apache.hadoop.hbase.regionserver.LeaseException: lease '5008606692699215376' does not exist

或

WARN org.apache.hadoop.ipc.HBaseServer: IPC Server listener on 60020: readAndProcess threw exception java.io.IOException: Connection reset by peer. Count of bytes read: 0
java.io.IOException: Connection reset by peer

一般都是rpc.timeout的默认时长60s内请求没有获取到响应，客户端直接关闭导致的，适当调大该参数有利于应对高并发的场景。

二.解决方案【以Spark程序为例】

动态指定hbase.rpc.timeout参数：

.config("hbase.rpc.timeout", "300000") // 设置rpc连接超时时间为5分钟

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

神之凝视

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

[HBase基础]-- spark创建hbase表(非分区表)

欢迎来到我的博客，一起探索代码里的世界！

09-10

3855

一、spark本地或者集群创建hbase表(不需要Kerberos认证)、并且插入数据 1、环境准备：idea 16+scala-2.10.4+cdh-spark-1.6.1+jdk-1.7+hbase-1.2.0-cdh5.8.0 2、 (1)创建maven工程:pdf-hbase (2)新建一个文件夹libs，导入cdh的spark jar，添加jar到项目中 spark-...

Docker本地搭建Hadoop高可用,Hbase,Spark,Flink,Zookeeper集群_基于docker容器,搭建hadoop+spark+hive+hbase+zookeeper sca

最新发布

2301_82243558的博客

04-29

1094

links: # 连接本compose文件创建的container。external_links: # 连接本compose文件以外的container。external_links: # 连接本compose文件以外的container。external_links: # 连接本compose文件以外的container。- “9091:9092” # 将容器的9092端口映射到宿主机的9091端口上。container_name: master # 节点名称。

参与评论您还未登录，请先登录后发表或查看评论

HBase的hbase.rpc.timeout参数引起的问题

云计算、分布式架构、K8S、大数据、机器学习、搜索、推荐、广告

02-25

1万+

在高并发压力测试时，发现对一个reginserver做scan操作的时，regionserver中偶尔会输出下面的错误： 2013-02-21 09:50:33,328 WARN org.apache.hadoop.ipc.HBaseServer: IPC Server listener on 60020: readAndProcess threw exception java.io

Spark1.x升级Spark2.x常见异常HBase篇【CallQueueTooBigException】

踏雪无痕

06-11

698

一.HBase之CallQueueTooBigException 查看RpcServer.java【路径：hbase-2.1.0-src\hbase-2.1.0\hbase-server\src\main\java\org\apache\hadoop\hbase\ipc】源代码可知，报CallQueueTooBigException异常的原因是，RPC队列过大！具体到此处的原因是：Spark升级到2.x版本后，性能大幅提升，同时因HBase升级大2.1导致使用Spark往HBase同步数据的效率大幅增加，进

HBase-客户端-超时机制设置

鲸鱼写程序的专栏

05-10

2448

背景当用户有一些大请求的时候，会报超时，但是用户觉得请求慢一些也能接受，如何设置？如果用户觉得HBase默认超时时间太长，希望请求超过一定毫秒数就报超时退出来，而不是一直在等待，如何设置？入手从网上搜索可以看到很多有关hbase客户端超时设置的参数说明不过并不是非常详细不过至少我们能定位到这几个参数，以进行入手 hbase.rpc.time...

hbase 设置超时参数

qq_22498427的博客

04-28

2132

hbase设计的目标是成为一个高可用集群，能够在失败的时候快速响应，当出现网络抖动等偶发情况时，能快速重试，让用户可以快速拿到结果。而不是一直卡着，使得上层应用阻塞等待。这个功能可以通过设置下面的3个超时参数、超时重试次数来实现。在超时的时候，立即主动断开，并重试。可以在当前集群上重试，也可以切换集群重试。

org.apache.hadoop.hbase.ipc.CallTimeoutException:row ‘12F3‘ on table ‘HBASETABLE‘ at region....

qq_43701760的博客

08-22

2754

今天在查HBASE表时，一批次大概千万条数据，表结构 rowkey是三个关键信息拼接的，A,B,C A 和 C 是多对多的关系, 在只有第一信息的情况下使用HBASE的范围查询+模糊查询，setStartRow(A) ,setStopRow(A)，RowFilter(RegexStringComparator©) 查询时报错： org.apache.hadoop.hbase.ipc.CallTimeoutException: Call id=6, waitTime=60030, rpcTimeout=

spark 2.X 疑难问题汇总

热门推荐

简单就好

12-29

3万+

当前spark任务都是运行在yarn上，所以不用启动长进程worker，也没有master的HA问题，所以主要的问题在任务执行层面。作业故障分类故障主要分为版本，内存和权限三方面。 - 各种版本不一致 - 各种内存溢出 - 其他问题版本不一致 1）java版本不一致报错：java.lang.UnsupportedClassVersionError: com/im

spark常见操作系列(3)--spark读写hbase(1)

cafebar123的专栏

03-18

1528

spark读写hbase,先写一下hbase的常用操作方式. hbase建表: create 'hbase_test_table', 'info', {NAME=>'info', SPLITALGO => 'HexStringSplit', REPLICATION_SCOPE =>0}, SPLITS => ['S0','S1','S2', 'S3', 'S4'...

spark core 根据查询条件条件删除hbase数据

m0_37813354的博客

09-20

1426

主要策略：一，读取hbase表数据二，获取rowkey字段，和过滤条件用的字段三，根据过滤条件，只保留需要删除的数据的rowkey 四，分批次删除hbase 数据（我这里每个批次10000条）具体代码如下： package ezr.bigdata.spark.hbase import java.util.{ArrayList, Li...

hbase 租约超时及rpc超时出现的问题

宏轩ＪＡＶＡ技术专栏

05-22

3817

随着数据量的增大，HIVE查询HBase的时候又出现了scan数据缓慢的问题，在HBase regionserver的log中出现了如下错误: [plain] view plaincopy org.apache.hadoop.hbase.regionserver.LeaseException: lease '-88413693092487843

【HBase学习之四】HBase Client超时机制优化

懂幸福，爱生活

01-04

1517

生产服务遇到过一个故障，大体来说就是hbase集群故障，在没有设置hbase客户端超时的情况下，导致大量线程阻塞，从而影响了tomcat对其他服务请求的正常响应（504网关超时，超时率30%），需要规避这个问题需要两个方面，1.设定客户端访问超时时间；2.服务资源隔离。本篇关注第一点。 hbase.rpc.timeout：一次RPC请求的超时时间，如果某次RPC时间超过该值，客户端就会主...

HBase 客户端 RPC 重试如何配置？

Shockang的博客

06-12

987

在 HBase 客户端到服务端的通信过程中，可能会碰到各种各样的异常。例如有以下几种导致重试的常见异常：下面我们了解一下HBase常见的几个超时参数。假设某业务要求单次 HBase 的读请求延迟不超过 1 s,那么该如何设置上述 4 个超时参数呢？首先，应该设成 1 s。其次，在 SSD 集群上，如果集群参数设置合适且集群服务正常，则基本可以保证 p99 延迟在 100ms 以内，因此设成 100...

Hbase CallQueueTooBigException 异常处理

weixin_34075551的博客

03-07

1307

CallQueueTooBigException异常一般出现在RPC服务中，由RpcServer.java知DEFAULT_MAX_CALLQUEUE_SIZE = 1024 * 1024 * 1024;，即若hbase.ipc.server.max.callqueue.size未设置的话，值默认值为1024*1024*1024（1G）。可以通过增加queue大小，修改hbase-site.x...

Spark拉取HBase数据时遇到的问题

淡定一生2333的博客

03-09

1136

问题1: org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle 5 从堆栈日志中可以看出，是BlockStoreShuffleReader在读取Shuffle到磁盘上的数据的时候发生的错误。从源码中可以看出，MapStauts==null才会跑出这个...

hbase client访问的超时时间、重试次数、重试间隔时间的配置（很重要）

weixin_34342992的博客

06-30

636

2019独角兽企业重金招聘Python工程师标准>>> ...

HBase之超时机制

happy19870612's blog

11-13

5803

客户端超时设置对整个系统的稳定性以及敏感性至关重要，一旦没有超时设置或超时时间设置过长，服务器端的长时间卡顿必然会引起客户端阻塞等待，进而影响上层应用。好在HBase提供了多个客户端参数设置超时，主要包括 hbase.rpc.timeout / hbase.client.operation.timeout/ hbase.client.scanner.timeout.period 一 hbase.

HBase客户端访问超时原因及参数优化

DataFlow范式

08-29

2万+

默认的HBase客户端的参数配置是没有做过优化的，所以对于低延时响应的HBase集群，需要对客户端的参数进行优化。1. hbase.rpc.timeout以毫秒计算的所有HBase RPC超时，默认为60s。该参数表示一次RPC请求的超时时间。如果某次RPC时间超过该值，客户端就会主动关闭socket。如果经常出现java.io.IOException: Connection rese