【Hbase迁移问题】hdfs get数据量过大导致kerberos票据失效问题记录

最新推荐文章于 2023-06-08 16:48:23 发布

xylzc

最新推荐文章于 2023-06-08 16:48:23 发布

阅读量362

点赞数 1

文章标签： hbase hdfs hadoop

本文链接：https://blog.csdn.net/lin86182824/article/details/128817877

版权

背景

老的集群A机器设备太老了，hbase读写性能差，需要迁移到新集群B。

问题

由于集群A和集群B不通，不能使用hdfs distcp、hbase快照、Replication同步、hbase导入导出等方式去做迁移

get方式

基于以上问题只能使用hdfs get的方式将数据get下来到机器上，再将get下来的数据put到新集群B，然后再通过元数据修复，上线region来解决。

kerberos报错

由于两个集群都是认证集群，我写了个脚本get后再put数据到新集群，但是发现有个5个多T的hbase表，get到3.6T的时候报错了。发现是kerberos认证信息过期，认证报错。

由于集群是生产环境，机器不能随便更改服务端配置，不能修改kerberos。所以只能想别的办法。

解决

1、不再使用shell脚本方式get再put。
2、直接nohup hdfs get xxxxx xxx & >./xxx.log
3、添加crontab定时任务，由于认证是24小时过期，直接添加了5小时执行一次认证。

目前为止get数据正常。

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xylzc

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【Hbase迁移问题】hdfs get数据量过大导致kerberos票据失效问题记录

hbase使用hdfs get方式迁移数据。
复制链接

扫一扫

kerberos 票据过期_Kerberos安全体系详解

weixin_39848953的博客

11-26

1108

1. Kerberos简介1.1. 功能一个安全认证协议用tickets验证避免本地保存密码和在互联网上传输密码包含一个可信任的第三方使用对称加密客户端与服务器(非KDC)之间能够相互验证Kerberos只提供一种功能——在网络上安全的完成用户的身份验证。它并不提供授权功能或者审计功能。1.2. 概念首次请求，三次通信方the Authentication Serverthe Ticket Gra...

Spark hadoop票据过期问题HDFS_DELEGATION_TOKEN

01-20

Spark streaming应用运行7天之后，自动退出，日志显示token for xxx(用户名): HDFS_DELEGATION_TOKEN owner=xxxx@xxxx.com, renewer=yarn, realUser=, issueDate=1581323654722, maxDate=1581928454722, sequenceNumber=6445344, masterKeyId=1583) is expired, current time: 2020-02-17 16:37:40,567+0800 expected renewal time: 2020-02-17

参与评论您还未登录，请先登录后发表或查看评论

显示hue的kerberos票据过期

n421529963的博客

05-16

203

kerberos

监控HDFS每天数据增量（Python2实现）

ArYe

11-29

2081

文章目录监控HDFS每天数据量 hadoop fs -df CDH截图 apache截图，待补充，不造一不一样 HIVE建表 Python脚本 #!/usr/bin/python2 import subprocess subprocess.check_output('hadoop fs -df', shell=True) 定时任务，每天零点执行 ...

CDH开启kerberos报错：Ticket expired

qq_32068809的博客

08-19

903

我是参考cloudera官方文档上的开启kerberos向导做的，地址：https://docs.cloudera.com/cdp-private-cloud-base/7.1.5/security-kerberos-authentication/topics/cm-security-kerberos-enabling-step4-kerberos-wizard.html 开启过程中，最后的启动集群步骤开始报错，报错的服务有kafka、hbase、JobHistory等，相关日志如下： kafka、hb

HBase分布式架构处理大数据量（高并发和实时处理）

01-27

本文来自于csdn，介绍了Hadoop的原理，HBase的特点，HBase 的高并发和实时处理数据，数据模型，工作流程等。(一)HDFS主要是用于做什么的？HDFS（HadoopDistributedFileSystem）分布式文件管理系统、是Hadoop项目的...

java操作Hbase之从Hbase中读取数据写入hdfs中源码

01-17

在Java编程环境中，操作HBase并将其数据写入HDFS（Hadoop Distributed File System）是一项常见的任务，特别是在大数据处理和分析的场景下。本篇将详细介绍如何使用Java API实现这一功能，以及涉及到的关键技术和...

hbase基于快照的数据迁移

07-10

### HBase基于快照的数据迁移 #### 前言 HBase是一款开源的、分布式的、面向列的数据库系统，其设计目标是为了处理大规模数据集（TB甚至PB级别）。随着业务的发展，数据量逐渐增大，可能需要将数据从一个集群迁移...

python3.6.5基于kerberos认证的hive和hdfs连接调用方式

09-16

在本文中，我们将深入探讨如何使用Python 3.6.5版本通过Kerberos认证来连接Hive和HDFS。Kerberos是一种广泛使用的网络身份验证协议，它为不安全的网络环境提供了安全的身份验证机制。它依赖于共享密钥加密来确保通信...

解决HBase空间占用过大问题

weixin_44376595的博客

08-04

2615

解决HBase空间占用过大问题问题现状：HBase中存储的数据不是很大，但是占用空间巨大解决方式：修改HBase表的压缩算法查看表压缩参数信息修改HBase表的压缩算法执行major compact执行后效果问题现状：HBase中存储的数据不是很大，但是占用空间巨大如下图可见HBase表中有几个占用空间未几十G 解决方式：修改HBase表的压缩算法查看表压缩参数信息通过desc命令可以查看到表的压缩算法COMPRESSION为NONE，这个是导致数据占用空间大的直接原因 hbase(main):0

解决macbook中访问 HDFS 时 kerberos 认证失败问题

最新发布

骑着蜗牛向前跑的博客

06-08

941

已经确定的是 macbook 上的大数据文件配置和 kerberos 认证文件全都正确。异常日志显示是找不到 Kerberos tgt 服务。查资料发现找不到 tgt 的原因很多，提出修改 JDK 配置甚至是重启大数据集群，明显不靠谱。访问 HDFS 是没有问题的。备注：上述方式缓存的认证信息使用。服务器将认证信息缓存在文件中，hadoop 访问 HDFS。是不能查看和删除的。重新认证并缓存在文件中。查看缓存的认证信息。

kerberos认证_0578-5.15.1-Kerberos环境下Java应用程序认证超时异常分析

weixin_39993454的博客

12-03

374

作者：谢敏灵/辉少1.文档编写目的在Kerberos环境中，我们的应用程序通过Java代码来提交任务需要先进行Kerberos凭证的初始化然后进行应用程序的提交，本文档主要讲述Java应用程序长时间运行作业Kerberos不自动重新认证问题测试环境1.CM和CDH版本为5.15.12.操作系统版本为RedHat7.23.集群已启用Kerberos2.问题描述在使用JDK 8时，在Kerberos环...

Hadoop集群（第8期）_HDFS初探之旅

weixin_33778778的博客

05-28

407

1、HDFS简介　　HDFS（Hadoop Distributed File System）是Hadoop项目的核心子项目，是分布式计算中数据存储管理的基础，是基于流数据模式访问和处理超大文件的需求而开发的，可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储，为超大数据集（Large Data Set）的应用处理带来了很...

hdfs上传文件中断后文件在系统中的情况

JiajunBernoulli的博客

04-18

661

面试的时候遇到了一个问题，hdfs上传文件中断后文件在系统中的情况是怎样的？这个平时还真的没有注意，所以自己做了一下实验来求证。 1.首先上传一个比较大的文件(至少得有两块吧)，然后在上次的时候中断。可以看到如下的异常，并提示我们可以删除已经存在的._COPYING_文件 2.webUI界面可以看到这个._COPYING_文件 3._COPYING_文件只有一块，并没有期待的两块(如果中断的...

如何续订用于 Amazon EMR 身份验证的过期 Kerberos 票证

eli的博客

11-18

554

Host。

hadoop3.1.3项目中get HDFS文件到本地出错

qq_40659767的博客

03-21

691

java idea hadoop get hdfs Could not locate Hadoop executable: ---\bin\winutils.exe HADOOP_HOME and hadoop.home.dir

Java登录Kerberos认证过期问题

huangyueranbbc的博客

11-30

7163

问题：最近CDH集群增加了kerberos认证，发现了JavaWeb应用启动后，超过24小时后，kerberos凭证过期到时查询Hbase失败的问题。 Spark程序连接CDH时，通过principal和keytab配置方式，内部会将凭证到hdfs上，供Executor和Driver使用。当凭证Ticket快要失效时，会通过Keytab重新生成凭证。 spark2-submit \ --master yarn \ --deploy-mode cluster \ --num-exec.

MapReduce操作HBase数据导入HDFS的实验

本实验旨在通过使用MapReduce将HBase表中的数据批量导入到HDFS上，学习如何使用MapReduce连接并读取HBase数据表，并了解HBase在分布式计算中的应用。实验环境：Centos 7.5操作系统，Apache Hadoop 2.7.3版本，...