1.索引的insert时间影响
a.Innodb (建表索引部分语句,下同)
PRIMARY KEY (id),
KEY index_log_data_on_log_time (log_time),
KEY index_log_data_on_req_site (req_site),
KEY index_log_data_on_req_originalUrl (req_originalUrl))
b.Innodb
PRIMARY KEY (id),
KEY index_log_data_on_log_time (log_time),
KEY index_log_data_on_req_site (req_site)
Query OK, 1500000 rows affected, 65535 warnings (3 min 32.72 sec)
实验1的a和b的区别只在于req_originalUrl的索引,req_originalUrl是一个很长的url字符串。效果相当明显。
3.1.2、按primary key的顺序插入行(InnoDB)
如果你用InnoDB,而且不需要特殊的聚簇索引,一个好的做法就是使用代理主键(surrogate key)——独立于你的应用中的数据。最简单的做法就是使用一个AUTO_INCREMENT的列,这会保证记录按照顺序插入,而且能提高使用primary key进行连接的查询的性能。应该尽量避免随机的聚簇主键,例如,字符串主键就是一个不好的选择,它使得插入操作变得随机。
2.不同引擎的百万数据Insert时间区别
a.Innodb
PRIMARY KEY (id,log_time),
KEY index_log_data_on_req_site (req_site)