场景:从blob 中 读取gps信息 数据量达到几百万,需要在一张表中查询出每台车的最新的 gps 信息 ;
复杂原因:表里边的数据每个 vin 有多条数据 ,time 字段不唯一。
SELECT * FROM car_gps a INNER JOIN (SELECT MAX(id) as id FROM car_gps GROUP BY vin) as b ON a.id = b.id LIMIT 1000;
首先分析:首先肯定是需要根据vin 进行分组的。所以首先需要为 vin 建立索引。
那么问题来了,什么情况下需要建立索引。
https://www.cnblogs.com/chenhaoyu/p/8761305.html
建立什么索引(各种索引的区别)
查看sql 执行时间:
set profiling = 1;
SELECT * FROM car_gps a INNER JOIN (SELECT MAX(id) as id FROM car_gps GROUP BY vin) as b ON a.id = b.id LIMIT 1000;
show profiles
查看sql 索引使用情况
explan SELECT * FROM car_gps a INNER JOIN (SELECT MAX(id) as id FROM car_gps GROUP BY vin) as b ON a.id = b.id LIMIT 1000;
- 查看表结构
desc table_name;
- 查看生成表的SQL
show create table table_name;
- 查看索引
show index from table_name;
- 查看执行时间
set profiling = 1;
SQL...
show profiles;
又想到Mysql 各种 join 的区别顺便查下,这里记录下
使用join连表,缺陷的情况下是inner join,开发中使用的left join和right join属于outer join,outer join还包括full join
现有两张表,Table A 是左边的表。Table B 是右边的表。其各有四条记录,其中有两条记录name是相同的:
1.INNER JOIN 产生的结果是AB的交集
SELECT * FROM TableA INNER JOIN TableB ON TableA.name = TableB.name
2.LEFT [OUTER] JOIN 产生表A的完全集,而B表中匹配的则有值,没有匹配的则以null值取代。
SELECT * FROM TableA LEFT OUTER JOIN TableB ON TableA.name = TableB.name
3.RIGHT [OUTER] JOIN 产生表B的完全集,而A表中匹配的则有值,没有匹配的则以null值取代。
SELECT * FROM TableA RIGHT OUTER JOIN TableB ON TableA.name = TableB.name
图标如left join类似。
4.FULL [OUTER] JOIN 产生A和B的并集。对于没有匹配的记录,则会以null做为值。
SELECT * FROM TableA FULL OUTER JOIN TableB ON TableA.name = TableB.name
可以通过is NULL将没有匹配的值找出来:
SELECT * FROM TableA FULL OUTER JOIN TableB ON TableA.name = TableB.name
WHERE TableA.id IS null OR TableB.id IS null
5. CROSS JOIN 把表A和表B的数据进行一个N*M的组合,即笛卡尔积。如本例会产生4*4=16条记录,在开发过程中我们肯定是要过滤数据,所以这种很少用。
SELECT * FROM TableA CROSS JOIN TableB来自: 兄弟连教育北京总校