TinyDbCluster大战MyCat纪实

最新推荐文章于 2022-01-15 21:16:05 发布

weixin_33975951

最新推荐文章于 2022-01-15 21:16:05 发布

阅读量190

点赞数

文章标签：数据库开发工具运维

原文链接：https://my.oschina.net/tinyframework/blog/1603207

版权

2019独角兽企业重金招聘Python工程师标准>>>

测试工具选择

由于TinyDBCluster是基于JdbcDriver层实现的分库分表方案，因此工具就只能选用支持自定义Driver的工具了，而MyCat由于是在通信层做的适配因此对工具不挑，这一点确实更方便一点，但是为了公平PK，因此就选择了Idea/DataGrip、NetBeans、DataVisualizer 3种工具来测试，Idea和DataGrip是同源工具基本相同，因此测试得时候用DataGrip了。选择3种工具也是考虑到不同的工具其内部实现细节还是有区别的，如果三种都可以比较好的支持，那说明普适性就基本没有问题了。

测试目的及测试用例设计

TinyDbRouter是在JDBCDriver层的实现方案，优点是各种数据库都可以支持确定就是只能支持Java系列的应用；MyCat是代理实现的方式，因此对于什么开发语言来说都可以非常好的匹配，但是对不同的数据库的支持上就相对困难一些，毕竟每种方案都有其固有的优点和缺点。

不论什么样的分库分表解决方案，都是期望提供一个对用户透明的解决方案，这里的用户不仅是开发人员，也针对实施和运维人员，毕竟当需要排查一个问题的时候，如果没有好的工具的支持，这不啻是一种灾难。因此，此次测试就直接通过工具来验证分库分表解决方案是否OK，如果能支持工具那么对于编程自然也问题不大。利用这些工具，我们只需要导入分库分表驱动，就能直观的进行增删改查以及修改数据结构的操作，管理分库分表的工作也将变的简单，这对于前期开发和后期运维都是非常有意义的。

其实我们使用数据库，主要使用的就是，表、视图、索引、元数据等等，因此此次测试得范围也限定在这些范畴，另外由于我们使用了分库分表，也希望与为分库分表的时候做一下对比，以便检视性能提升的情况，由于条件限制，10个分片数据都在一个物理数据库上，这会导致由于资源冲突而没有达到线性增长的目的，但是由于TinyDbCluster和MyCat使用的都是一样样的10个分片，因此对于对比结果并没有太大的影响。

测试目的

1.客观、公正地评估其易用性:主要通过数据库工具来验证TinyDBCluster和MyCat支持哪些sql，以及与工具的兼容性。

2.性能：通过工具，我们可以清晰的看到使用TinyDBCluster和MyCat以后性能是否有提升、提升多少。

测试环境

1.测试工具

Idea/DataGrip、NetBeans、DataVisualizer

2.数据环境

数据库：单台mysql数据库中分biz_0、biz_1、biz_2...biz_9 共十个库。

分库表：t_org和t_user。分片键均是org_id。t_org数据总量200万。

TinyDbCluster和mycat均采用取余算法分片。 200万数据均匀分配到十个库中。

测试过程

1 功能性验证

1.1 sql执行器

1.1.1 元数据命令

分类	功能点	预想结果	实测结果
Dbvisualizer	Netbeans	idea
show命令	show variables	能显示所有分库的并集	通过	通过	通过
	show databases	包含默认数据库的所有库的并集以及tinydbcluster	通过	通过	通过
	show tables	包含分库分表的表以及分分库分表的表	通过	通过	通过
	show columns from t_org	包含所有字段，字段类型正确	通过	通过	通过
	show processlist	显示所有库show processlist的并集	通过	通过	通过
use命令	加上use以后再执行show tables。比如use biz_1,biz_1库和biz_0库不一样。看看是不是显示biz_1库的table	显示biz_1库的所有库。	通过	通过	通过

1.1.2 DDL语句

功能点	预想结果	实测结果
Dbvisualizer	Netbeans	idea
create table	所有分库都能创建表t_org	通过	通过	通过
alter table	所有分库的t_org表的注释都改过来	通过	通过	通过
新增字段	所有分库的t_org表都增加该字段	通过	通过	通过
修改字段	所有分库t_org表字段都会修改过来	通过	通过	通过
删除字段	所有分库t_org表字段都被删除	通过	通过	通过
新增索引	所有分库t_org表都会新建索引	通过	通过	通过
删除索引	所有分库t_org表的该索引都会被删除	通过	通过	通过
新增视图	只会在默认库biz_0新增视图	通过	通过	通过
删除视图	该视图在biz_0中删除，并且不会报错	通过	通过	通过

1.1.3 增删改查

分库的表t_org的增删改查。

1.1.3.1 基本的增删改查

分类	功能点	预想结果	实测结果
insert	普通insert语句 insert多条数据	能插入到不同的分片	通过
	insert不加字段名	能插入成功	通过
delete	delete from t_org where org_id=123	看日志，路由到了biz_3这个库中，并且能删除成功	通过
	in:delete from t_org where org_id in(109,983,1039,10002,30001)	看日志，能路由到相应分片中，并且都能删除成功	通过
	between:delete from t_org where org_id between 300002 and 300004	看日志，能路由到相应分片中，并且都能删除成功	通过
	truncate t_org	所有分片中的t_org被清空	通过
update	=：update t_org set org_name='aaa' where org_id=125	看日志，能路由到相应分片中，而不是所有分片都执行。并且能更新数据	通过
	in：update t_org set org_name='eee' where org_id in(104,985,1034,10009,10001)	看日志，能路由到in中对应分片中，而不是所有分片都执行。并且能更新数据	通过
	between：update t_org set org_name='fff' where org_id BETWEEN 123 and 132	看日志，能路由到between对应分片中。并且能更新数据。	通过
	非分片键：update t_org set org_name='fff' where org_name='bbb'	看日志。所有分片都执行。并且更新成功。	通过
select	select * from t_org where org_id=12532	看日志，被路由到biz_2分片中。结果正确	通过
	select org_id,org_name from t_org where org_id=12532	同上。	通过
	in: select * from t_org where org_id in (123,456,789)	看日志，能路由到相关分片。并且结果正确	通过
	between:select * from t_org where org_id between 123 and 456	看日志。能路由到相关分片。并且结果正确	通过
	select * from t_org	所有分片都执行。最后结果正确	通过

1.1.3.2 group by语句

功能点	预想结果	实测结果
select org_detail,count(org_detail) from t_org group by org_detail	返回结果正确，并且快速返回	通过
select org_detail from t_org group by org_detail desc	返回结果正确，并且快速返回	通过
常规函数，比如concat:select * from t_org where org_name like concat('%,',org_id,',%')	返回结果正确，并且快速返回	通过
max函数		通过
min函数		通过
avg函数		通过
sum函数		通过

1.1.3.3 分页查询

功能点	预想结果	实测结果
select * from t_org order by org_id desc limit 0,100	从第1条数据开始往后100条，有序排列	通过
select * from t_org order by org_id desc limit 100	从第1条数据开始往后100条，有序排列	通过
select * from t_org order by org_id desc limit 1,100	从第2条数据开始往后100条，有序排列	通过
连续执行多次 select * from t_org order by org_id limit 0,100; select * from t_org order by org_id limit 1,50; select * from t_org order by org_id limit 52,100; select * from t_org order by org_id limit 1,50	多次执行多条语句结果都没问题	通过

其他sql

功能点	预想结果	实测结果
表备份：create table t_user_bk (select * from t_user);	在默认数据库biz_0,创建t_user_bk表，并且会将biz_0中的表复制到t_user_bk中。	通过

带null的数据group by、order by

功能点	预想结果	实测结果
group by字段数据带null：select org_detail,count(*) from t_org group by org_detail desc。也就是org_detail中数据有null	不会报错，且结果正确。最终null的数据也在分组中	通过
group by 函数中数据带null。 select count(org_detail)...		通过
order by字段数据带null。 select org_detail,sum(bbb),count(aaa) from biz_0.t_org order by org_detail desc		通过
不带group by的函数。select org_detail,sum(bbb),count(aaa) from t_org order by org_detail desc		通过
is null放到where字句中		通过
update语句中is null放到where字句中		通过
update t_org set abc=null where org_id=134		通过
delete语句中is null放到where字句中		通过
insert语句中加入字段值为null		通过

1.2 工具图形界面

1.2.1 表结构

分类	功能	预测结果	实测结果
Netbeans	idea
数据库基本信息	展开左侧数据库列表	包含原生库中的所有catalog。是否会比原生的多出一个dbcluster的专属catalog（tinydbcluster）。	通过	通过
table	建表		通过	通过
	修改表		通过	通过
	删除表		通过	通过
	新增字段		通过	通过
	修改字段			通过
	删除字段		通过	通过
index	新增索引		通过	通过
	删除索引		通过	通过
view	新增视图		通过	通过
	点开视图，能看到数据		通过	通过
	删除视图		通过	通过

1.2.2 数据

1.2.2.1 使用工具查看数据，并且修改、删除、新增操作

分类	功能	预测结果	实测结果
Netbeans	idea
insert	新增一条数据，分片键有值	数据能插入到算法对应分片中	通过	通过
	新增多条数据，分片键有值	数据能插入到不同库中	通过	通过
update	直接编辑数据，修改分分片键的值，保存	能保存成功。	通过	通过
	直接编辑数据，修改多条数据（对应多个分片）	都能保存成功。查看日志，只对应到一个分片	通过	通过
delete	直接在工具上删除某条数据	能删除成功	通过	通过
	直接在工具上删除多条数据（不同分片）	均能删除成功	通过	通过
select	点开后能看到所有数据		通过	通过
	点击某个字段进行排序		通过	通过

2 性能测试，并且与原生数据库、mycat进行对比。

事先准备好原生数据库以及mycat环境

原生数据库

新建单表t_org，数据量200万，与之前分库分表的数据一致。

mycat：安装mycat，修改配置文件schema.xml，将t_org,t_user均分到10个库(biz_0...biz_9)中，同样采用取余算法(mod-long)；将sqlMaxList改成了1000000。（因为mycat在对sql语句都做了limit限制，性能测试时应排除此干扰）。

<mycat:schema xmlns:mycat="http://io.mycat/">
        <schema name="TESTDB" checkSQLschema="true" sqlMaxLimit="10000000">
                ...
                
  </mycat:schema>

工具中执行命令。

show命令。dbcluster都能执行通过，而mycat对个别语句不支持。但显示的结果会略有不同，请看说明

功能点	是否支持	说明
tinydbcluster	mycat
show variables	支持	支持
show databases	支持	支持	dbcluster显示所有库名，而mycat只显示TESTDB(虚拟schema)
show tables	支持	支持	dbcluster会显示所有库中表的并集，而mycat则会显示默认数据库的所有表，以及mycat配置的虚拟表
show columns from t_org	支持	支持
show columns from t_user_bk（非分库分表的表）	支持	不支持	mycat错误信息：[3D000][1046] No dataNode found ,please check tables defined in schema:TESTDB
show processlist	支持	支持
加上use以后再执行show tables。比如执行 use biz_1;show tables; use tinydbcluster;show tables; use biz_1;show tables; 看看biz_0,biz_1只显示自己库中table，而tinydbcluster库包含所有库中的table	支持	不支持	MYCAT只支持USE TESTDB，TESTDB为虚拟schema

DDL语句比较

dbcluster和mycat支持对分库table的创建修改删除、对字段的新增修改删除

dbcluster的优势是除了以上功能之外还支持对非分库table的DDL语句，支持对索引和视图的DDL语句、支持use语句切换不同的数据库（包括原生数据库和原生的biz_0-biz_9）。

它的好处就是无需频繁切换数据源，就能访问到原生数据源的数据。

分类	功能点	是否支持	说明
tinydbcluster	mycat
ddl table	create table	支持	支持
	alter table :比如加注释	支持	支持
	drop table	支持	支持
	非分库分表的表执行create table、alter table、drop table	支持	不支持	mycat报[42000][1064] op table not in schema----
ddl 字段	alter table 修改字段	支持	支持
	alter table 新增字段	支持	支持
	alter table drop字段	支持	支持
ddl index	ALTER TABLE `t_org` ADD INDEX `abc`(`org_name`) COMMENT 'aaa';	支持	不支持	mycat [42000][1064] op table not in schema----
	drop index	支持	不支持	mycat [42000][1064] op table not in schema----
ddl view	create view。 create view abcd as select * from t_org	支持	不支持	mycat [42000][1064] op table not in schema----
	drop view drop view abcd	支持	不支持	mycat [42000][1064] op table not in schema----
	create view 带schema。 create view biz_1.abcd as select * from t_org; drop view biz_1.abcd	支持	不支持	mycat [42000][1064] op table not in schema----
use语句	select * from t_org where org_id in (1,2,3) 语句。会显示所有包含库中该表记录集的总和(1、2、3 3条数据)。执行use biz_0。再执行该语句。（biz_0为其中一个原生数据库的库名）。然后执行select * from t_org where org_id in (1,2,3)语句。其结果集和select * from biz_0.t_org where org_id in (1,2,3)一样。执行use tinydbcluster。再执行select * from t_org where org_id in (1,2,3)语句。其结果又变回了1、2、3 三条数据。	支持	不支持	[42000][1049] Unknown database 'biz_0'

基本增删改查语句

mycat对分库table的insert、update、delete、select均不支持，而这些，dbcluster都是支持的。

经过多次执行，dbcluster和mycat执行时间相近。

大项	分类	功能点	是否支持	执行时间	说明
tinydbcluster	mycat	原生	tinydbcluster	mycat
insert	insert非分库分表	insert语句	支持	不支持
	insert分库分表	普通insert语句	支持	支持
		insert into abc(id,name) select * from abc_bk(id,name)	不支持	不支持				mycat [42000][1064] TODO:insert into .... select .... not supported!
		insert不加字段	支持	不支持				mycat [42000][1064] partition table, insert must provide ColumnList
	select非分库分表	常规单表select语句	支持	不支持				mycat [42000][1064] can't find table define in schema T_USER_BK schema:TESTDB Details
select	select分库分表	select * from t_org where org_id=12532	支持	支持	1s 800ms-3s	150-180ms	170-190ms
		select org_id,org_name from t_org where org_id=12532	支持	支持	1s 800ms-3s	150-180ms	150-180ms
		in： select * from t_org where org_id in (123,454,780)	支持	支持	1s 300ms-1s 800ms	170-210ms	180-200ms
		between：select * from t_org where org_id BETWEEN 10000 and 20000	支持	支持	1s 300ms-1s 600ms	360-400ms	360-420ms	取前十万条的执行时间，不包括fetch时间
		select * from t_org	支持	支持	400-600ms	2s 500ms-3s 200ms	6s-12s	mycat执行很慢
		常规函数，比如concat:select concat('%',org_id,'%') from t_org	支持	支持	50-100ms	800ms-1s	3s-4s	mycat执行很慢
		select * from t_org order by org_id desc	支持	支持	5-6s	3.5-5s	8-9s	mycat执行很慢
		表前加schema/catalog:select * from biz_1.t_org order by org_id desc	支持	不支持	600-800ms	600-800ms	7-8s	mycat执行很慢，而且所有结果不正确，请看截图
		不带group by的函数。select org_detail,sum(bbb),count(aaa) from t_org order by org_detail desc	支持	支持	1s - 1s 600ms	300-600ms	350-500ms
		表前加schema
		非分片键：select * from t_org where org_name='tiny129'	支持	支持	1s 400ms-2s	350-500ms	350-500ms
update	update分库分表	update t_org set name='aaa' where org_id=124	支持	支持
		update t_org set org_name='eee' where org_id in(104,985,1034,10009,10001)	支持	支持	1s 500ms-2s	100-200ms	100-200ms
		update t_org set org_name='fff' where org_id BETWEEN 123 and 132	支持	支持	1s 500ms-2s	600-700ms	600-700ms
		update t_org set org_name='fff' where org_name='bbb'	支持	支持	1s 500ms-2s	600-700ms	600-700ms
		update is null条件	支持	支持
		update set abc=null	支持	支持
delete	delete分库分表	delete from t_org where org_id=123	支持	支持	1s 500ms-2s	150-200ms	150-200ms
		delete from t_org where org_id in (5001,5002,5003)	支持	支持	1s 500ms-2s	250-450ms	200-400ms
		delete from t_org where org_id between 5010 and 5025	支持	支持	1s 500ms-2s	650-700ms	650-750ms
		truncate语句	支持	支持

group by

功能点	是否支持	执行时间	说明
tinydbcluster	mycat	原生	tinydbcluster	mycat
select org_detail from t_org group by org_detail desc	支持	支持	5-6s	3s 100ms-3s 300ms	3s 100ms-3s 300ms
select org_detail,count(org_detail) from t_org group by org_detail	支持	支持	13-14s	4-5s	4-5s	mycat排序不正确，应该是不支持group by …desc 请看截图
select org_detail,count(org_detail) from t_org group by org_detail desc	支持	不支持	13-14s	4-5s	4-5s
select org_detail,max(org_id),min(org_id),sum(org_id),avg(org_id) from t_org group by org_detail	支持	支持	16-17s	4s 500ms-5s	4s 500ms-5s
having:select org_detail,avg(org_id) from t_org group by org_detail having avg(org_id)>1000000	不支持	不支持				dbcluster没对having做特殊处理；mycat数据也不正确
非分片键和分片键做联合查询：select * from t_org where org_id=1234 and org_name='tiny1234'	支持	支持	1s 300ms -2s	140-160ms	140-150ms

分页查询

功能点	是否支持	执行时间	说明
tinydbcluster	mycat	原生	tinydbcluster	mycat
select * from t_org order by org_id desc limit 0,100	支持	支持	1s 300ms-1s 700ms	300-600ms	300-600ms
select * from t_org order by org_id desc limit 100	支持	支持	1s 300ms-1s 700ms	300-600ms	300-600ms
select * from t_org order by org_id desc limit 1,100	支持	支持	1s 300ms-1s 700ms	300-600ms	300-600ms
select * from t_org order by org_id desc limit 1000000,1000	支持	支持	4-5s	14-15s	2s 600ms-3s

其他sql

功能点	是否支持	执行时间	说明
tinydbcluster	mycat	原生	tinydbcluster	mycat
非分片键：select * from t_org where org_name='tiny129'	支持	支持	1s 400ms-2s	350-500ms	350-500ms
表备份：create table t_user_bk (select * from t_user);	支持	不支持