mysql关于大型数据查找删除和添加索引的调查报告

为了研究性能,所以必须先引入大量的数据,基数据为1600多个,现在执行insert into xn_profile (select * from xn_profile)来不断增加数据。
其时间分别为0.11sec,0.27sec,0.35sec,0.39sec,1.6sec,3.45sec,7.38sec,27.41sec,46.72sec,99.66sec,大概是线性变化,但是不稳定,尤其7.38到27.41。

[b]在437216的基数上查询[/b]
select count(*) from xn_profile where university="南京大学";

时间为2.27秒,但是再次查询相同的却用了0秒。


随后在university上建立了索引。
create index university_index on xn_profile(university);
花了44.93秒。
再次执行相同的查询
select count(*) from xn_profile where university="南京大学";

花了0.06秒


随后
select count(*) from xn_profile where university="清华大学"
,清华大学比南京大学少得多得多(大概1/100),也只用了0.05秒。


select count(*) from xn_profile where province="江苏";
在没有索引的情况下用了2.9秒,查了江西,也是2.79秒。


再去掉索引,花了27.94秒。


[b]随后将基数上升到1730000[/b],原数据的4倍
select count(*) from xn_profile where university="东南大学";

用了11.16秒,差不多是2.27秒的4倍,符合顺序查找的规律。


select count(*) from xn_profile;
也用了11.79秒。
此时再次建立索引用了223秒。


然后执行相同的
select count(*) from xn_profile where university="清华大学"
,用了0.13秒,查东南大学用了0.42秒,查南京大学2.03秒。


再增加一倍的数据,356秒(包括创建额外索引的时间),这个时间也不知道是应该怎么看
才好。[b]基数达到3475000[/b]
select count(*) from xn_profile;
用了52.67秒,这个比是11.26秒的5倍,搞不懂了,怎么会增长这么快?


select count(1) from xn_profile where university="东南大学";
只用了0.83秒


 select count(1) from xn_profile where university="南京大学";
用了4.33秒


我插了一条数据,
 insert into xn_profile(university) values("test");
select count(1) from xn_profile where university="test";
用了0秒,快得一比。


mysql在不同的连接时也会缓存查询结果。
此时,备份该表,用了将近2分钟。数据量达820兆,当然都是sql语句,不敢打开。


结论1、在插入insert操作时时间随插入量大致是线性变化的。
结论2、mysql会把之前查询到的结果缓存,可以跨连接缓存。
结论3、影响索引查询的主要因素取决于数据量的多少,在数据量整体都不是很大时看不出来,但是数据量很大很大时,就明显了。貌似是根号关系,即数据量增加x的平方倍,时间增加x倍。
结论4、在顺序查找(无索引的情况下)时,查询时间主要受查询时间的影响而非io传输的影响。
结论5、我认为顺序查询主要受查询时间的影响。而索引查询主要受io数据传输的影响。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值