TiDB删除大数据的处理

最新推荐文章于 2025-02-11 22:23:50 发布

canger_

最新推荐文章于 2025-02-11 22:23:50 发布

阅读量3.3k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：数据库文章标签：数据库

本文链接：https://blog.csdn.net/Canger_/article/details/124290540

在 TiDB 的架构中，所有数据以一定 key range 被切分成若干 Region 分布在多个 TiKV 实例上。随着数据的写入，一个集群中会产生上百万个甚至千万个 Region。单个 TiKV 实例上产生过多的 Region 会给集群带来较大的负担，影响整个集群的性能表现。

数据删除后查询速度为何会变慢？

大量删除数据后，会有很多无用的 key 存在，影响查询效率。可以尝试开启 Region Merge 功能，具体看参考最佳实践中的删除数据部分。

开启 Region Merge

开启 Region Merge 也能减少 Region 的个数。与 Region Split 相反，Region Merge 是通过调度把相邻的小 Region 合并的过程。在集群中删除数据或者执行 Drop Table/Truncate Table 语句后，可以将小 Region 甚至空 Region 进行合并以减少资源的消耗。
通过 pd-ctl 设置以下参数即可开启 Region Merge：

>> pd-ctl config set max-merge-region-size 20
>> pd-ctl config set max-merge-region-keys 200000
>> pd-ctl config set merge-schedule-limit 8

在k8s当中查看pd的设置

$ kubectl exec -it basic-pd-0 -n tidb-cluster
$ ./pd-ctl config show
{

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

canger_

关注关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

大数据实时分析：ClickHouse、Doris、TiDB 对比分析

晴天彩虹雨的博客

05-19

1112

TiDB 表分区

jiangbenchu的博客

03-31

9812

前置条件对比MySQL的表分区使用之前，要先读官方文档表分区，注意事项确认表中是否存在唯一键(包括主键) ，如果存在，那么唯一键中，必须包含分区表达式中用到的所有列如果表中不存在唯一键，那么第1条规则也就不需要遵守了分区列是主键列，那么分区列不可以是 NULL 分区表达式中列的数据类型，要与表中列的数据类型相符合删除分区一定会删除分区中所有数据，不会自动转移数据 MAXV...

1 条评论您还未登录，请先登录后发表或查看评论

TiDB安装配置--PD缩容

llliarby的博客

03-18

931

1、从集群中移除节点（中控机执行）： 1.1 查看需要移除节点的name: /home/tidb/tidb-ansible/resources/bin/pd-ctl -u "http://集群已有的PD中的一个IP:2379" -d member 1.2 从以上列表中找出需要删除节点对应的name，假设为pd9 1.3 删除pd9（删除PD节点很快，会返回success） /home...

TiDB查询优化

qq_37480069的博客

04-07

1086

TiDB的正确使用姿势，查询优化。

批量写入tidb提高写入效率

shy_snow的专栏

05-30

3541

在url中增加allowMultiQueries=true&rewriteBatchedStatements=true&useConfigs=maxPerformance&useServerPrepStmts=true开启批量提交sql,并在代码中使用批量提交的方式提高写入效率; ps.addBatch(); if (i % batchSize == 0) { ps.executeBatch(); ...............

TiDB Lightning 常见问题

weixin_42241611的博客

09-05

309

本文列出了一些使用 TiDB Lightning 时可能会遇到的问题与答案。

TiDB 在 Pinterest丨从 HBase 到 TiDB：我们如何实现零停机在线数据迁移

TiDB 社区干货传送门

09-06

656

原文来源： https://tidb.net/blog/fe86fdc8 ...

TiDB，金融级开源NewSQL

最新发布

qq_42969817的博客

02-11

804

本文介绍了国内自研且开源的NewSQL数据库TiDB，它具备分布式强一致性事务、水平扩展、高可用等特性，几乎满足了对数据库的所有需求，堪称数据库中的“六边形战士”。文章回顾了数据库技术的发展历程，从人工管理阶段到文件系统阶段，再到现代的数据库系统阶段。最后，文章总结了TiDB的前景和挑战，指出虽然部署成本较高，但在特定行业和业务领域中具有巨大潜力。

TiDB集群大规模删除实践

HULK一线技术杂谈

11-04

1113

女主宣言TiDB在写入一段时间后，会存在一些可清理的数据。对这些数据进行删除，可以释放集群的空间。本文描述了在清理数据过程中，遇到的问题和具体的排查步骤，希望对有相同需求的同学有所帮助。...

Mysql replace 与　insert on duplicate效率分析

weixin_34246551的博客

02-01

839

导读我们在向数据库里批量插入数据的时候，会遇到要将原有主键或者unique索引所在记录更新的情况，而如果没有主键或者unique索引冲突的时候，直接执行插入操作。这种情况下，有三种方式执行：直接直接每条select, 判断，　然后insert，毫无疑问，这是最笨的方法了，不断的查询判断，有主键或索引冲突，执行update,否则执行...

tidb迁移常见问题

Data & Analysis

12-31

1224

全量数据导出导入如何将一个运行在 MySQL 上的应用迁移到 TiDB 上？ TiDB 支持绝大多数 MySQL 语法，一般不需要修改代码。不小心把 MySQL 的 user 表导入到 TiDB 了，或者忘记密码，无法登录，如何处理？重启 TiDB 服务，配置文件中增加-skip-grant-table=true参数，无密码登录集群后，可以根据情况重建用户，或者重建 mysql.user 表，具体表结构搜索官网。在 Loader 运行的过程中，TiDB 可以对外提供服务吗？该操作进..

复制 order 表的效率挑战

TiDB 社区干货传送门

01-03

248

作者： pepezzzz 原文来源： https://tidb.net/blog/d8310c21 ...

数据分析者必备：TiDB数据库的性能优化和调优实践

AI天才研究院

07-01

4502

作者：禅与计算机程序设计艺术《39. 数据分析者必备： TiDB 数据库的性能优化和调优实践》 1. 引言 1.1. 背景介绍随着大数据时代的到来，数据已成为企业核心资产之一。数据存储与处理

TiDB集群方案与Replication原理

ajffaj的博客

10-06

475

TiDB的集群方案

TiDB-merge region相关问题

line_on_database的博客

02-09

1533

一、开启region merge # 控制 Region Merge 的 size 上限，当 Region Size 大于指定值时 PD 不会将其与相邻的 Region 合并 pd-ctl config set max-merge-region-size 20 # 控制 Region Merge 的 key 上限，当 Region key 大于指定值时 PD 不会将其与相邻的 Region 合并 pd-ctl config set max-merge-region-keys 200000 # 同时进行的 R

使用tidb-toolkit批量删除/更新数据

TiDB 社区干货传送门

08-09

387

作者： realcp1018 原文来源： https://tidb.net/blog/2056c25c ...

TiDB：数据库垃圾回收机制解析

TiDB 社区干货传送门

11-12

293

作者： Ming 原文来源： https://tidb.net/blog/828bbbb6 ...

TiDB数据过大无法删除和更新

互联网知识分享

05-07

846

执行sql，接收返回结果, executeUpdate可以作为删除功能. 定义Sql语句 -- 删除大于7天数据，select datediff('2021-10-31','2021-8-31');连接mysql的驱动用的是java连接的，scala条用java，java调用mysql-->可以使用循环的方式每次删除5百万条。）目前tidb如果在插入或删除大量的数据，比如一亿条的数据，就会出现。这里随便设置多少，只要不等于0就可以。）解决办法，就是分批删除。可以使用循环的方式每次删除。