前言
紧接着上一篇文章TiDB经验分享01 的内容接着往下更新,在上一篇文章中主要论述了TiDB的基础架构和其包含的两种存储引擎 TiKV TiFlash,这一篇我们主要论述TiDB在生产使用的特点 和MySQL的对比 以及TiDB在生产应用中正确的使用方式。
TiDB的特点
首先南国论述下TiDB 这款数据库的一些优点,具体论述如下:
● 与 MySQL 的兼容型比较好,绝大多数 SQL 语句和相关工具都可以直接使用。
○ 支持慢查询日志
○ 支持和 MySQL 之间的主从同步等功能。
○ TiDB 的默认隔离级别为可重复读,支持修改。
○ 支持调整 sql mode、autocommit、time zone 等参数。
○ 存储(TiKV)和计算(TiDB)均可以横向拓展。
○ 数据默认保存三个副本(可调整),可以确保绝大多数情况下的数据安全。
○ 各个组件都具备高可用性,部分实例宕机不影响整体的可用性。
○ 底层支持tikv行存和tiflash列存两种存储形式。
○ 支持历史数据查询。set @@tidb_snapshot="2016-10-08 16:45:26"
之后就可以查询这个时间点的历史数据。
■ 历史数据默认只保存 10 分钟,可以根据实际需求修改。
■ 历史数据保留的时间会影响备份,如果备份时间比较长,需要适当的调高这个保留时间。
简单总结下,TiDB这款数据库和MySQL的兼容性很好,能够支持MySQL的大部分语法包括DDL DML等,同时它自身计算和存储相分离的特性使得它进行水平扩展非常方便(个人认为计算和存储相分离这点 是未来大势 例如Kakfa对比pulsar)
接下来讲述一下tidb使用过程中的缺点:
● 不支持非 UTF-8 的字符集(例如 GBK)。
○ 暂时只能依靠 dump
来做严格一致性的备份。
■ dump
的备份和备份恢复都非常慢。
■ 可以考虑使用硬盘 snapshot 方式来做备份(基于 LVM),备份速度可以做到较快,但是数据恢复速度仍然很慢。
■ 3.1 GA 会提供官方的备份方案。
○ TiDB 默认不会对数据进行 hash 和拆分,有可能会出现热点效应,导致少量 TiKV 节点的负载高于其他节点。
■ TiDB 提供了工具,可以手工重新调整数据分布。
■ 也可以使用 TiDB 的隐藏主键,增加 SHARD_ROW_ID_BITS
的表定义来做到数据拆分。
TiDB与mysql的兼容性
TiDB 高度兼容 MySQL 5.7 协议、MySQL 5.7 常用的功能及语法。MySQL 5.7 生态中的系统工具 (PHPMyAdmin、Navicat、MySQL Workbench、mysqldump、Mydumper/Myloader)、客户端等均适用于 TiDB。
但 TiDB 尚未支持一些 MySQL 功能,官方解释 可能的原因如下:
- 有更好的解决方案,例如 JSON 取代 XML 函数。
- 目前对这些功能的需求度不高,例如存储流程和函数。
- 一些功能在分布式系统上