doris升级到2.0.1启动FE报错

本文介绍了如何升级Doris版本2.0.1,处理FE启动失败、元数据恢复步骤,解决时钟对齐问题,并处理升级后decimal类型精度变化。涉及FE集群管理、元数据备份与恢复、环境一致性检查等技术细节。
摘要由CSDN通过智能技术生成

升级参考:Datasophon升级doris版本为2.0.1-CSDN博客

升级以前一定要备份元数据 doris_meta  很重要
参考:元数据运维 - Apache Doris

问题一:FE启动失败,fe.log中一直滚动 "wait catalog to be ready. FE type UNKNOWN"

首先我是两台FE (元数据备份过,一台Follower(为master)一台Observer)

1.首先停掉集群

2.在所有 FE 的元数据目录下查看image/image.xxxx

3.找出image.xxxx 这个xxxx 数字最大的这个节点,这个数字最大说明这个节点的元数据是最新的

4.直接在conf/fe.conf 中加入 metadata_failure_recovery=true,先回复Follower

5.在访问正常之后,将上面元数据恢复模式设置成false,或者将这个配置项注释掉

6.基于Observer 使用上面元数据恢复模式,将Follower 恢复正常之后

7.在MySQL 客户端或者命令行下连接Follower(Master)节点

8.执行下面的命令(将Observer从集群中删除掉)

ALTER SYSTEM DROP OBSERVER "OBSERVER_IP:9010"; 我的端口是9010 这里将所有的Observer从集群中删除掉 OBSERVER_IP:你要删除的Observer 节点IP PORT:fe.conf 中的 edit_log_port,默认9010

9.后到Observer 节点上,将Observer 元数据目录清空(先备份)只保留doris-meta

10.然后使用下面的命令启动Observer(主要是指定master节点)

sh bin/start_fe.sh --helper master_fe_ip:port --daemon master_fe_ip:你要Master FE 节点IP,如果是单个Follower就是你的这个Follower节点IP port:fe.conf 中的 edit_log_port,默认9010

11.在MySQL 客户端或者命令行下连接Follower(Master)节点执行下面的命令(添加Observer到集群中)

ALTER SYSTEM ADD OBSERVER "OBSERVER_IP:PORT"; 这里是你刚才启动Observer节点加入到集群中那个 OBSERVER_IP:你要加入的Observer 节点IP PORT:fe.conf 中的 edit_log_port,默认9010

12.查看FE运行状态

show fontends; 查看FE(Follower 和你刚才添加的 Observer 运行状态是否正常) 你也可以通过查看你刚才添加的Observer 的日志log/fe.log 观察是否启动正常

问题二:时钟对齐问题导致

[BDBEnvironment.getDatabaseNames():325] bdb environment failure exception.
com.sleepycat.je.EnvironmentFailureException: (JE 7.3.7) Environment must be closed, caused by: com.sleepycat.je.EnvironmentFailureException: Environment invalid because of previous exception: (JE 7.3.7) 10.225.7.117_9010_1629189808444(14):/home/doris/palo/data/meta-data/bdb Clock delta: 7167 ms. between Feeder: 10.225.7.118_9010_1628770841427 and this Replica exceeds max permissible delta: 5000 ms. HANDSHAKE_ERROR: Error during the handshake between two nodes. Some validity or compatibility check failed, preventing further communication between the nodes. Environment is invalid and must be closed. Originally thrown by HA thread: RepNode 10.225.7.117_9010_1629189808444(-1) Originally thrown by HA thread: RepNode


查看两台fe节点服务器时间后发现差10s  后手动调整一致 也可使用ntp
问题三、Doris升级后 decimal类型保留两位小数的数据,后边突然多了好多0

原来的decimal 是decimalv2, 他实际是固定的precision 27 和 scale 9,可以通过schema change,把decimalv2 转换成decimalv3
alter table ads_xxx  modify column export_goods decimalv3(20, 2)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值